Hvorfor katastrofal scenarietestning ud over fremstilling er afgørende for sikkerhed i kritisk infrastruktur

Det hidtil usete FAA-afbrydelse, der resulterede i, at alle indenrigsflyvninger blev sat på grund, får alle til at stille spørgsmål:

Hvordan skete det?

Hvem er ansvarlig?

Hvordan forhindrer vi, at noget lignende opstår igen?

Dette afbrydelse har gjort os opmærksomme på, at selv de systemer, som vi anser for at være de mest sikre, pålidelige og validerede, kan fejle.

Selvom denne type afbrydelse, der når til niveauet af offentlig bevidsthed, er sjælden, kan det, når en sker i et livskritisk system, føre til en lavine af katastrofale resultater, der påvirker sikkerhed, sikkerhed og økonomi. Vi ser dette nu med afbrydelse af transporten og konsekvenserne af overbelastningen i web-/app-tjenester oversvømmet med tusindvis af passagerer, der kæmper for at komme til deres destinationer.

Mens dagens FAA-afbrydelse betragtes som en systemfejl, var det en yndefuld nedbrydningsfejl. Det betyder, at der heldigvis ikke var nogen dødsfald som følge af fejlen, og systemet lukkede effektivt ned, før der skete mere skade.

Dette er heldigt, men ikke opmuntrende.

Test har altid været brugt i fremstillingen til at opdage defekter - fejlsimulering var for eksempel en metode til kunstigt at "bryde" en enhed for at se, om diagnostiske tests ville opdage og isolere fejl ned til deres grundlæggende årsager. Når man designer software, bliver ingeniører undervist i at designe efter specifikationen af, hvad det skal gøre funktionelt. Der blev brugt meget mindre indsats på at lede efter de katastrofale scenarier eller en "perfekt storm" af forhold, der skal opstå, som fører til systemfejl. Foregribelse af disse forhold kan hjælpe os med proaktivt at indbygge mekanismer til proaktivt at opdage og forhindre katastrofale fejl.

Forebyggelse af fremtidige afbrydelser og andre kritiske infrastruktursvigt

Med udbredelsen af ​​cloud computing og kunstig intelligens-løsninger har vi nu effektiv nok beregningskraft til at evaluere millioner af operationelle scenarier for at opdage, hvilke sager der kan resultere i katastrofale scenarier.

For FAA skulle det nu være muligt proaktivt at analysere forholdene og data fra alle indenrigslufthavne, fly i himlen og på jorden, såvel som dem, der er planlagt til fremtidig brug, kontroltårnskommunikation og relaterede infrastrukturer, passagerer, vejr, og sikkerhed for at udspille scenarier, der kan resultere i systemfejl.

Hvis man overvejer kompleksiteten af ​​dette systems interaktioner og indbyrdes afhængigheder, er det klart, at det er et skræmmende forslag at se på alle fejlpunkter.

Kunstig intelligens kan hjælpe med at analysere denne overvældende mængde data for proaktivt at lede efter mønstre og adfærd, der kan udgøre udfordringer for FAA-systemer.

Dette er ikke hidtil uset, da kunstig intelligens er blevet brugt til bedre at undersøge trafikmønstre for optimeret planlægning og logistik.

Teknologien kan også implementeres som en kraftfuld forsvarsmekanisme til at give tidlig opdagelse af cyberangreb og/eller unormal adfærd i systemer. Nøglen til effektivt at implementere sådanne systemer vil være at isolere disse specifikke afvigere og forhold, så de kan undersøges af menneskelige eksperter.

Der er mange erfaringer at lære af FAA-afbrydelsen, og med tiden vil vi have et klarere billede af, hvad der skete. Men indtil videre er det tydeligt, at nye teknologier, såsom kunstig intelligens, der muliggør proaktiv detektering af systemfejl og andre udfordringer, der kan opstå, har en fremtrædende rolle at spille i, hvordan vi vedligeholder vores kritiske infrastruktur fremover.

Kilde: https://www.forbes.com/sites/karenpanetta/2023/01/11/the-perfect-storm-of-the-faa-outage-why-catastrophic-scenario-testing-beyond-manufacturing-is- afgørende-for-kritisk-infrastruktur-sikkerhed/