- Mala privatna Discord grupa je navodno dobila neovlašteni pristup Claude Mythos Previewu putem okruženja treće strane izvođača radova.
- Mythos je model kibernetičke sigurnosti zasnovan na umjetnoj inteligenciji rezervisan za nekolicinu korporativnih i institucionalnih partnera u okviru projekta Glasswing.
- Grupa je navodno pogodila online lokaciju modela koristeći konvencije imenovanja, procurele podatke i privilegije izvođača radova.
- Anthropic istražuje i tvrdi da trenutno nema dokaza o utjecaju na njihove ključne interne sisteme, ali slučaj izaziva zabrinutost u vezi s lancem snabdijevanja i kontrolom pristupa.
Nedavno otkriće navodni neovlašteni pristup Anthropicovom modelu Claude Mythos putem Discorda ponovo je pokrenuo tešku debatu u svijetu umjetne inteligencije: kako dijeliti moćne alate za kibernetičku sigurnost, a da se napadačima ne da upravo ono što im je potrebno? Mala online grupa tvrdi da je uspjela koristiti Mythos sedmicama, uprkos tome što je sistem bio ograničen na strogo kontroliranu probnu verziju.
Prema više izvještaja, incident nije uključivao spektakularan hakerski napad u holivudskom stilu, već kombinacija dozvola izvođača radova, online detektivskog rada i nagađanja na osnovu znanja o tome gdje Anthropic hostuje svoje najosjetljivije sisteme. Za model dizajniran za pronalaženje i iskorištavanje softverskih ranjivosti u velikim razmjerima, sama sugestija da bi autsajderi mogli eksperimentirati s njim privukla je pažnju sigurnosnih stručnjaka, kompanija i vlada.
Šta je Claude Mythos i zašto je važan
Claude Mythos Preview je Anthropicov novi AI sistem fokusiran na sajber sigurnost., predstavljen kao model opšte namjene s neuobičajeno naprednim mogućnostima za otkrivanje, pa čak i iskorištavanje nedostataka u operativnim sistemima i web preglednicima. Umjesto da ga objavi javnosti, Anthropic je pozicionirao Mythos kao ograničeni alat za odbranu kritične infrastrukture.
Početkom aprila, kompanija je predstavila Mythos kao dio inicijative poznate kao Projekt GlasswingU okviru ovog programa, samo je kratki popis pouzdanih organizacija pozvan da testira model. Izvještaji spominju velike tehnološke i poslovne igrače poput Amazona, Microsofta, Applea, Cisca i Nvidije, kao i finansijske institucije poput Goldman Sachsa, među onima koji su dobili rani pristup za kontrolirane eksperimente.
Partneri pripisuju Mythosu zasluge za otkrivanje značajnog broja sigurnosnih problema. Jedan istaknuti primjer, koji se više puta navodi u izvještavanju o incidentu, je Mozilla, koja je navodno koristila model za identificirati i zakrpiti stotine ranjivosti u FirefoxuAnthropic je također tvrdio da je Mythos pomogao u otkrivanju hiljada ozbiljnih nedostataka u široko korištenom softveru.
Ti rezultati su izazvali i optimizam i nelagodu. S jedne strane, automatsko otkrivanje suptilnih grešaka i pogrešnih konfiguracija moglo bi pomoći braniteljima da ostanu ispred napadača. S druge strane, sistem koji pojednostavljuje složene ofanzivne tehnike rizikuje da postane multiplikator sile za cyber kriminal, posebno ako njegove zaštitne ograde ili model pristupa zakažu.
Regulatori su to već primijetili. Britanski Institut za sigurnost umjetne inteligencije navodno je procijenio Mythos i zaključio da može izvršavaju višestepene sajber napade uz ograničen ljudski angažman, ponekad dovršavajući simulirane lance napada koji bi iskusnim profesionalcima inače oduzeli dane rada. Ta procjena doprinijela je percepciji Mythosa kao modela koji pomiče granice u smislu sajber rizika.

Kako Discord grupa kaže da je ušla
U tom kontekstu, pojava Labavo organizirana Discord grupa koja traži pristup Mythosu izazvalo je razumljivu zabrinutost. Izvještaji koje su prikupili Bloomberg i drugi mediji opisuju scenario u kojem su se znatiželja, insajderske veze i istraživanje otvorenog koda kombinirali kako bi zaobišli navodno uski perimetar pristupa.
Članovi grupe učestvuju u privatni Discord kanal posvećen praćenju neobjavljenih AI modelaNjihov deklarirani cilj, barem javno, jeste da eksperimentišu sa najsavremenijim sistemima koji još nisu dostupni široj javnosti. Pojedinci koji su u to uključeni nisu formalno identifikovani, ali je opisano da jedan član radi za izvođača radova koji pruža usluge kompaniji Anthropic.
Čini se da je veza s izvođačem radova bila ključna. Izvještaji pokazuju da je ta osoba privilegovani pristup kao eksterni dobavljač bio je jedan dio slagalice. Uz taj insajderski oslonac, članovi su se oslanjali na uobičajene tehnike istraživanja interneta kako bi mapirali infrastrukturu Anthropica, kao i na prethodno znanje o tome kako kompanija imenuje i implementira svoje modele.
Nedavno curenje podataka u Mercoru, zasebnom startupu za umjetnu inteligenciju, navodno je pružilo dodatne tragove. Informacije iz tog proboja, u kombinaciji s prethodnim konvencijama imenovanja korištenim za antropske modele, omogućile su Discord grupi da napravi „dobro informirana pretpostavka“ o online lokaciji Claudea MythosaUmjesto da se nasilno probiju unutra, oni su efektivno pogodili prava vrata i zatim prošli kroz njih s podacima vezanim za okruženje izvođača radova.
Nakon što su dobili funkcionalan pristup, grupa je navodno redovno koristila Mythos više od dvije sedmice. Bloomberg kaže da je pregledao snimke ekrana i demonstraciju uživo što je izgleda potvrdilo da je model zaista radio i odgovarao na upute koje su izdali neovlašteni korisnici. Postoje i tvrdnje da su drugi neobjavljeni Anthropic modeli bili dostupni korištenjem istog pristupa, iako detalji o tim sistemima ostaju oskudni.
Šta Grupa tvrdi da je uradila sa Mythosom
Učesnici Discorda su javno pokušali da se distanciraju od ideje da su sajber kriminalci. Jedan član, citiran u izvještaju o epizodi, rekao je da interes grupe leži u isprobavanje novih modela umjetne inteligencije umjesto pokretanja napadaPrema njihovom mišljenju, Mythos je korišten za relativno benigno eksperimentiranje, poput generiranja jednostavnih web stranica i testiranja upita.
Također sugeriraju da su izbjegavali visokorizično ponašanje koje bi moglo pokrenuti alarme unutar Anthropicovih sistema za praćenje. Grupa se navodno suzdržavala od očigledno zlonamjernih upita i od obima aktivnosti koji bi se isticali, umjesto toga ciljajući na "letjeti ispod radara" dok istražujete mogućnosti modelaIz dostupnih izvještaja, do sada nema konkretnih dokaza da je grupa koristila Mythos za kompromitovanje ciljeva u stvarnom svijetu.
Čak i ako su ti samoopisi tačni, incident je izazvao nelagodu među sigurnosnim stručnjacima. Nakon što se pokaže održiv put do ograničenog sistema, Imitatori mogu pokušati replicirati tehniku, potencijalno sa vrlo različitim motivima. Činjenica da ovaj prvi talas neovlaštenih korisnika tvrdi da nema zlonamjernu namjeru malo uvjerava branitelje da razmišljaju o tome šta slijedi.
Epizoda je također istakla koliko osjetljiv pristup može zavisiti od ponašanja malog broja pojedinaca. Jedan izvođač radova s djelomičnim privilegijama i spremnošću da krši pravila, u kombinaciji s određenom upornošću na privatnom Discordu, očigledno je bio dovoljan da... narušiti namjeravanu izolaciju visokorizičnog modela umjetne inteligencije.
Anthropic-ov odgovor i problem lanca dobavljača
Anthropic je potvrdio izvještaje i kaže da provodi formalnu reviziju. U izjavi podijeljenoj s medijima, kompanija je napomenula: „Istražujemo prijavu u kojoj se tvrdi da postoji neovlašteni pristup Claude Mythos Previewu putem jednog od naših okruženja trećih strana.“ Formulacija je oprezna, ali značajna.
Kompanija naglašava da u ovoj fazi ima nema dokaza da se aktivnost proširila na njegove ključne korporativne sisteme ili da je njegova interna infrastruktura direktno kompromitovana. Ograničavanjem problema na okruženje dobavljača, Anthropic efektivno povlači granicu između svojih centralnih operacija i okruženja koje koristi izvođač radova povezan s Discord grupom.
Međutim, upravo ta razlika brine mnoge posmatrače. Ako se Mythos može kontaktirati iz okruženja treće strane, onda Sigurnosni stav svakog vanjskog partnera postaje dio površine napadaOva situacija ilustruje klasičan rizik lanca snabdijevanja: čak i ako kompanija ojača vlastite mreže, slabosti ili pogrešne konfiguracije među dobavljačima mogu otvoriti neočekivana vrata.
Incident se također kolidira s načinom na koji je Projekt Glasswing bio reklamiran. Logika programa je bila da strogo ograničavanje pristupa na pažljivo odabranu listu organizacija držalo bi Mythos podalje od protivnika, a istovremeno bi omogućilo korisno testiranje i povratne informacije. Ideja ekskluzivnosti bila je ključna: samo veliki, provjereni subjekti bi mogli ispitati model, smanjujući mogućnost zloupotrebe.
Ako bi neformalna Discord grupa mogla početi koristiti Mythos istog dana kada je najavljen, taj narativ postaje teže održati. Čak i ako još uvijek nema znakova napada iz stvarnog svijeta koji se mogu povezati s modelom, epizoda sugerira Perimetar oko osjetljivih AI sistema može biti krhkiji nego što je predviđeno, posebno kada su u toku eksterni izvođači radova i partneri.
Šira zabrinutost oko „premoćne“ vještačke inteligencije za sajber sigurnost
Pored specifičnih detalja ovog slučaja, priča o Mythosu ulazi u širu diskusiju o Alati umjetne inteligencije koji brišu granicu između odbrane i napadaMythos je promoviran kao neka vrsta "crvenog tima u kutiji", sposobnog simulirati složene napadače i otkriti slabosti mnogo prije nego što ljudski protivnici naiđu na njih.
Istraživači sigurnosti su podijeljeni oko toga kako protumačiti tu tvrdnju. Neki su skeptični da sistem umjetne inteligencije, koliko god napredan, može pouzdano otkriti nove ranjivosti brzinom koja se navodi u marketinškim materijalima. Drugi tvrde da, ako su tvrdnje čak i djelimično tačne, rizik od Sajber napadi potpomognuti vještačkom inteligencijom postaju brži, jeftiniji i skalabilniji je nešto što kreatori politika moraju uzeti u obzir prilikom regulisanja.
Komentari poznatih ličnosti iz industrije, uključujući rukovodioce firmi za sigurnost u oblaku, odražavaju mješavinu radoznalosti i zabrinutosti. S jedne strane, branioci vide priliku da automatizirati zamornu analizu i testiranje softvera pod stresom u realističnim scenarijima napadaS druge strane, zamišljaju šta se dešava ako se slični modeli namjerno podese za napad i šire se distribuiraju ili ako se zaštitne ograde namijenjene sprječavanju štetne upotrebe pokažu lako zaobilaznim.
Vladine agencije počinju tretirati ova pitanja kao strateška, a ne isključivo tehnička. Anthropic je navodno označen kao „rizik lanca snabdijevanja“ od strane Ministarstva odbrane SAD-a, uz tekuće diskusije o tome šta bi ta oznaka trebala podrazumijevati i da li se može revidirati. Međunarodna sigurnosna tijela također vide sisteme poput Mythosa kao testne slučajeve za rukovanje tehnologijama umjetne inteligencije dvostruke namjene.
Incident s pristupom Discordu stoga se događa u osjetljivom trenutku. Za regulatore, to može poslužiti kao rani primjer izazova u policijskom radu, odnosno ko može koristiti moćne modele umjetne inteligencije. kako se njihov pristup revidira i koje obaveze imaju pružaoci usluga kada stvari krenu po zlu. Za kompanije koje razmatraju slične alate, to postavlja praktična pitanja o dokumentaciji, evidentiranju i segregaciji osjetljivih okruženja.
Šta ovo znači za kompanije, korisnike i upravljanje umjetnom inteligencijom
Za organizacije koje su razmatrale Mythos ili slične sisteme, ovaj događaj će vjerovatno potaknuti nove procjene rizika. Osnovna napetost je jednostavna: Iste karakteristike koje model čine privlačnim za odbranu mogu ga učiniti opasnim ako se s njim nepravilno rukuje.Ako čak i ograničeni pregledi mogu procuriti u neformalne zajednice, pretpostavke o tome ko zapravo koristi ove alate možda će trebati ažurirati.
Iz perspektive korporativne sigurnosti, ovaj slučaj naglašava potrebu za pomnim ispitivanjem cijeli lanac pristupa, uključujući izvođače radova i manje dobavljače a Produkcijsko raspoređivanje timova AI agenataPolitike koje na papiru izgledaju robusno mogu se raspasti u stvarnim okruženjima gdje ljudi ponovo koriste akreditive, smanjuju troškove radi praktičnosti ili tretiraju okruženja za pregled kao manje rizična. Organizacije mogu odlučiti da im je potrebna stroža segmentacija za AI sisteme koji direktno interaguju sa živim kodom i infrastrukturom.
Za svakodnevne korisnike i zaposlenike, priča je podsjetnik da umjetna inteligencija nije samo još jedan dio poslovnog softvera. Sistemi poput Mythosa mogu sažeti vrijeme i stručnost potrebnu za istraživanje slabosti, što uvećava uticaj bilo kakvog curenja ili zloupotrebe. Ta realnost može pokrenuti nove interne okvire za obuku i upravljanje o tome ko može ispitivati modele visokog rizika i pod kojim uslovima.
Na frontu upravljanja umjetnom inteligencijom, postoji sve veći pritisak da se ide dalje od dobrovoljnih smjernica. Incidenti poput ovog pozivaju na... formalni standardi o kontroli pristupa, otkrivanju incidenata i nezavisnoj reviziji za najsposobnije modele. Bez obzira da li se kreatori politika odluče za blagi nadzor ili strožu regulaciju, vjerovatno će kao opravdanje ukazati na slučajeve u kojima su ograničeni alati proklizali u neslužbene kanale.
Za sam Anthropic, mnogo toga zavisi od toga šta će otkriti njegova tekuća istraga: kako je pristupni put detaljno funkcionisao, koliko je ljudi bilo uključeno i koje tehničke ili proceduralne promjene će biti implementirane nakon toga. Bez obzira na ishod, epizoda Mythos je već postala referentna tačka u diskusijama o... Kako ograničiti naprednu umjetnu inteligenciju u području kibernetičke sigurnosti na uloge koje su joj tvorci namijenili, i šta se dešava kada to ograničenje dođe pod pritisak.
Spajajući sve ove niti zajedno, navodni neovlašteni Discord pristup Claude Mythosu ističe koliko brzo vrhunska umjetna inteligencija može preći uredno definirane granice u najavama lansiranja, otkrivajući praznine u sigurnosti dobavljača, testirajući robusnost obećanja "samo uz poziv" i prisiljavajući kompanije, regulatore i korisnike da preispitaju način na koji upravljaju alatima koji mogu i ojačati i potencijalno potkopati digitalnu odbranu na koju se oslanjaju.