AI Mythos naštrbila bezpečnosť NSA za pár hodín, ľudom by to trvalo dni

Po sociálnych sieťach sa tieto dni rýchlo šíri jedna veta, ktorá znie ako scenár k akčnému filmu. Vraj model umelej inteligencie s názvom Mythos prelomil takmer všetky utajované systémy americkej Národnej bezpečnostnej agentúry (NSA), a to za pár hodín. Realita je menej dramatická, ale paradoxne ešte zaujímavejšia, a hlavne je dôležité rozumieť tomu, čo sa naozaj odohralo. V tomto článku si rozoberieme len túto jednu časť celého príbehu, teda samotný test v NSA, pretože práve ona je novinka, ktorá rozprúdila vážnu politickú debatu o tom, ako by sa mala umelá inteligencia kontrolovať.

Odkiaľ tá informácia vlastne pochádza

Začnime tým, že si ujasníme, kto čo povedal, lebo práve tu vzniká väčšina nedorozumení. Informácia neprišla z oficiálneho vyhlásenia NSA, ani z tlačovej správy Anthropicu. Pôvodcom je americký senátor Mark Warner, ktorý je podpredsedom spravodajského výboru amerického Senátu, čo je orgán dohliadajúci na tajné služby. Warner verejne opísal, čo mu povedal generál Joshua Rudd, šéf NSA a zároveň americkej kybernetickej obrany. Tento jeho opis následne zachytil renomovaný týždenník The Economist v dlhšej analýze od novinára Shashanka Joshiho.

Reťazec informácie teda vyzerá takto. Generál Rudd to povedal senátorovi Warnerovi, Warner to spomenul na brífingu, novinár Joshi to odcitoval a sociálne siete z toho spravili virálnu senzáciu. Každý ďalší článok o tom, čo sme čítali v predošlých dňoch o vypnutí modelov Anthropicu, sa opiera práve o tento jediný citát. O širšom kontexte celej kauzy sme písali v článku Najsilnejšiu AI Fable 5 museli vypnúť, tu sa však sústredíme výhradne na samotný test.

Najsilnejšiu AI Fable 5 museli vypnúť: 10 veci, ktoré by ste mali vedieť

Čo je vlastne Mythos

Aby celá vec dávala zmysel, treba vedieť, o aký model ide. Mythos je najsilnejší model od spoločnosti Anthropic, teda od firmy, ktorá stojí aj za známym asistentom Claude. Na rozdiel od verejne dostupných modelov nebol Mythos nikdy voľne prístupný bežným ľuďom, prístup k nemu malo len niečo okolo štyridsiatich preverených organizácií. Model je primárne zameraný na kybernetickú bezpečnosť, čiže presne na hľadanie a analýzu slabín v počítačových systémoch. Práve preto sa o neho zaujímali aj inštitúcie ako NSA.

Jeho verejnejším príbuzným je model Fable 5, ktorý zdieľa rovnakú základnú architektúru, líši sa však v poistkách, ktoré majú blokovať nebezpečné odpovede. Ak ťa zaujíma, čo Fable 5 priniesol pri svojom predstavení, spísali sme to v článku Anthropic zverejnil novú najsilnejšiu AI: Je tu Claude Fable 5.

Anthropic zverejnil novú najsilnejšiu AI: Je tu Claude Fable 5

Nebol to hack, bol to autorizovaný test

Toto je najdôležitejšia časť celého príbehu a zároveň tá, ktorú virálne príspevky najčastejšie zamlčia. Mythos nezaútočil na NSA zvonku, neprenikol do ničoho, čo by nemal, a nikto nič neukradol. Išlo o takzvaný red team test, čo je úplne bežná a legitímna bezpečnostná prax. V praxi to znamená, že samotná NSA modelu dobrovoľne povedala, tu sú naše vlastné systémy alebo ich verné kópie, skús v nich nájsť slabé miesta. Je to to isté, ako keď si firma najme etického hackera, aby sa pokúsil dostať do jej siete a upozornil ju na diery skôr, než ich nájde skutočný útočník.

Práve preto je formulácia, že NSA niečo oficiálne potvrdila, alebo že AI prelomila tajné systémy, hrubo zavádzajúca. NSA nevydala žiadne oficiálne vyhlásenie a nešlo o reálny prienik do funkčnej operačnej siete, ale o kontrolované cvičenie vo vlastnom prostredí agentúry. Rozdiel medzi prienikom do reálnej siete a nájdením slabín v testovacom prostredí je obrovský, aj keď v titulkoch často úplne zanikne.

Prečo je to napriek tomu znepokojujúce

Ak to teda nebol útok, prečo to vôbec riešime? Odpoveď neznie čo Mythos urobil, ale ako rýchlo to urobil. V autorizovanom cvičení dokázal model nájsť a pospájať zraniteľnosti vo veľkej časti testovaných utajovaných systémov, a zvládol to v rádoch hodín. Ľudský bezpečnostný tím robí presne tú istú prácu zvyčajne týždne alebo dokonca mesiace. Práve táto rýchlosť je to, čo generálovi Ruddovi nedávalo spávať a čo z bežného interného cvičenia spravilo politickú tému.

Predstavme si to na jednoduchej analógii. Keď zamkneš bezpečnostného experta do banky a dáš mu za úlohu nájsť všetky slabiny, nie je to lúpež a banka o tom vie. Ak však ten expert nájde cestu k trezoru za dve hodiny namiesto dvoch mesiacov, banka má vážny problém s tým, čo by dokázal skutočný zlodej s rovnakými schopnosťami. A presne toto je dôvod, prečo výsledky testu vyvolali takú reakciu, lebo ukázali, akú silu môže mať pokročilý model v rukách niekoho s nekalými úmyslami.

Dôležitý detail, ktorý sa stratil: Mythos nepracoval sám

Keď citát začal žiť vlastným životom, sám novinár Shashank Joshi, ktorý ho ako prvý zverejnil, neskôr upozornil, že by sa nemal čítať doslova. Vysvetlil, že výsledok závisel od toho, že Mythos pracoval spoločne s ďalšími nástrojmi a za určitých podmienok. Inými slovami, nebol to jeden všemocný model, ktorý sám od seba rozlúskol obranu NSA, ale skôr súčasť širšej zostavy nástrojov, ktoré dohromady dosiahli tento výsledok.

Tento detail je zásadný, pretože pochádza priamo od primárneho zdroja celej správy. Aj zjednodušené slovné spojenie, že model niečo prelomil, je teda technicky nepresné a opisuje zložitejší proces jednou efektnou vetou. Pri hodnotení celej kauzy treba mať toto na pamäti, inak si z nej odnesieme silnejší obraz, než aký mal pôvodný autor na mysli.

Prečo o tom Warner vôbec hovoril

Možno ťa prekvapí, že senátor Warner tento príklad nepoužil na to, aby Anthropic skritizoval, ale práve naopak, aby ho pochválil. Jeho argument znel, že ak je nejaký model takto schopný, nemôžeme nechať jeho testovanie len na dobrovoľnosti firiem, ktoré ho vyrábajú. Warner chcel touto rétorikou presadzovať povinné a nezávislé preverovanie najsilnejších modelov ešte predtým, než sa dostanú von. Celá historka mu teda poslúžila ako silný argument za reguláciu, nie ako obvinenie konkrétnej spoločnosti.

A práve v tomto je skutočný význam tejto novinky. Nešlo o to, že by sa AI zbláznila a napadla štát, ale o to, že výsledky kontrolovaného testu boli natoľko presvedčivé, že posunuli debatu o pravidlách pre umelú inteligenciu o veľký kus dopredu. O tom, ako sa svet snaží na takéto schopnosti reagovať aj na medzinárodnej úrovni, sme písali v článku Vznikne Medzinárodná aliancia pre kontrolu AI?.

Vznikne Medzinárodná aliancia pre kontrolu AI?

Čo si z toho odniesť

Ak by sme mali celú vec zhrnúť do jednej férovej vety, znela by takto. NSA nechala model Mythos otestovať vlastné systémy v kontrolovanom prostredí a výsledky boli natoľko rýchle a dôkladné, že zmenili politickú debatu o regulácii umelej inteligencie. Nebol to hack, nebol to prienik a NSA nič oficiálne nepotvrdila. Bol to test, ktorý prebehol presne tak, ako mal, len jeho výsledok ukázal, kam sa schopnosti najsilnejších modelov posunuli.

Pre nás bežných pozorovateľov je z toho hlavné ponaučenie, že pri podobných senzačných titulkoch sa oplatí spomaliť a opýtať sa, kto to vlastne povedal a v akom kontexte. Rozdiel medzi vetou AI prelomila tajné systémy NSA a vetou NSA si otestovala AI a zľakla sa výsledku je obrovský, hoci opisujú tú istú udalosť. A práve schopnosť rozlíšiť medzi týmito dvoma vetami je dnes možno užitočnejšia zručnosť než čokoľvek iné.

Ak ťa téma vývoja najsilnejších modelov a ich kontroly zaujíma, sleduj ďalej náš blog, kde celý príbeh okolo Anthropicu rozoberáme priebežne.

Mythos naštrbil bezpečnosť NSA za pár hodín, ľudom by to trvalo dni