Uautorisert Discord-tilgang til Anthropics Claude Mythos utløser ny AI-sikkerhetsfrykt

Siste oppdatering: 04/24/2026
Forfatter: C SourceTrail
  • En liten privat Discord-gruppe skal angivelig ha fått uautorisert tilgang til Claude Mythos Preview gjennom et tredjeparts leverandørmiljø.
  • Mythos er en AI-nettsikkerhetsmodell reservert for en håndfull bedrifts- og institusjonspartnere under Project Glasswing.
  • Gruppen skal angivelig gjettet modellens plassering på nett ved hjelp av navnekonvensjoner, lekkede data og entreprenørrettigheter.
  • Anthropic etterforsker og sier at det ikke finnes bevis for påvirkning på kjernesystemene i selskapet, men saken reiser bekymringer knyttet til forsyningskjeden og tilgangskontroll.

Uautorisert tilgang til Mythos på Discord

Den nylige avsløringen av påstått uautorisert tilgang til Anthropics Claude Mythos-modell via Discord har gjenopplivet en vanskelig debatt i AI-verdenen: hvordan deler man kraftige verktøy for nettsikkerhet uten å gi angriperne akkurat det de trenger? En liten nettgruppe hevder at de klarte å bruke Mythos i flere uker, til tross for at systemet var begrenset til en strengt kontrollert forhåndsvisning.

Ifølge flere rapporter involverte ikke hendelsen et spektakulært hackerangrep i Hollywood-stil, men snarere et kombinasjon av entreprenørentillatelser, online etterforskning og kvalifiserte gjetninger om hvor Anthropic er vert for sine mest sensitive systemer. For en modell som er designet for å finne og utnytte programvaresårbarheter i stor skala, har selve antydningen om at utenforstående kunne eksperimentere med den vakt oppmerksomhet fra både sikkerhetseksperter, selskaper og myndigheter.

Hva Claude Mythos er og hvorfor det er viktig

Claude Mythos Preview er Anthropics nye AI-system fokusert på cybersikkerhet, presentert som en generell modell med uvanlig avanserte muligheter for å oppdage og til og med utnytte feil i operativsystemer og nettlesere. I stedet for å offentliggjøre den, posisjonerte Anthropic Mythos som et begrenset verktøy for å forsvare kritisk infrastruktur.

Tidlig i april avduket selskapet Mythos som en del av et initiativ kjent som Prosjekt GlasswingUnder dette programmet ble bare en kort liste over pålitelige organisasjoner invitert til å teste modellen. Rapporter nevner store teknologi- og bedriftsaktører som Amazon, Microsoft, Apple, Cisco og Nvidia, samt finansinstitusjoner som Goldman Sachs, blant dem som får tidlig tilgang til kontrollerte eksperimenter.

Partnere har gitt Mythos æren for å ha avdekket et betydelig antall sikkerhetsproblemer. Et fremtredende eksempel, som gjentatte ganger er nevnt i dekningen av hendelsen, er Mozilla, som angivelig brukte modellen til å identifisere og oppdatere hundrevis av sårbarheter i FirefoxAnthropic har også hevdet at Mythos har bidratt til å avdekke tusenvis av alvorlige feil i mye brukt programvare.

Disse resultatene har gitt næring til både optimisme og uro. På den ene siden, automatisk deteksjon av subtile feil og feilkonfigurasjoner kan hjelpe forsvarere med å holde seg foran angriperne. På den annen side risikerer et system som effektiviserer komplekse offensive teknikker å bli en kraftmultiplikator for nettkriminalitet, spesielt hvis rekkverket eller tilgangsmodellen svikter.

Regulatorer har allerede tatt det til etterretning. Storbritannias AI Safety Institute skal ha evaluert Mythos og konkludert med at det kan utføre flertrinns cyberangrep med begrenset menneskelig innsats, og noen ganger fullfører simulerte angrepskjeder som normalt ville tatt erfarne fagfolk dager med arbeid. Denne vurderingen bidro til en oppfatning av Mythos som en modell som flytter målstengene når det gjelder cyberrisiko.

Tilgangshendelse for AI-nettsikkerhetsmodell

Hvordan Discord-gruppen sier at de kom inn

Mot den bakgrunnen, fremveksten av en løst organisert Discord-gruppe som hevder tilgang til Mythos har skapt forståelig bekymring. Rapportene som er samlet inn av Bloomberg og andre kilder skisserer et scenario der nysgjerrighet, innsidekontakter og åpen kildekode-forskning kombinert omgår en angivelig begrenset tilgangsperre.

Medlemmer av gruppen deltar i en privat Discord-kanal dedikert til sporing av uutgitte AI-modellerDeres uttalte mål, i hvert fall offentlig, er å eksperimentere med banebrytende systemer som ennå ikke er tilgjengelige for allmennheten. De involverte personene er ikke formelt identifisert, men ett medlem ble beskrevet som arbeider for en entreprenør som leverer tjenester til Anthropic.

Den entreprenørforbindelsen ser ut til å ha vært nøkkelen. Rapporter tyder på at personens privilegert tilgang som ekstern leverandør var én brikke i puslespillet. Ved siden av dette fotfestet innenfra, brukte medlemmene vanlige internettforskningsteknikker for å kartlegge Anthropics infrastruktur, samt forhåndskunnskap om hvordan selskapet navngir og distribuerer modellene sine.

En nylig datalekkasje hos Mercor, en separat AI-oppstartsbedrift, skal angivelig ha gitt ytterligere ledetråder. Informasjon fra dette datalekkasjet, kombinert med tidligere navnekonvensjoner brukt for Anthropic-modeller, tillot Discord-gruppen å lage en «velinformert gjetning» om hvor Claude Mythos befinner seg på nettetI stedet for å brutalt trenge seg inn, gjettet de i praksis den riktige døren og gikk deretter gjennom den med legitimasjon knyttet til entreprenørmiljøet.

Etter at de hadde fått fungerende tilgang, skal gruppen ha brukt Mythos regelmessig i mer enn to uker. Bloomberg sier at de har gjennomgått skjermbilder og en live demonstrasjon som så ut til å bekrefte at modellen faktisk kjørte og svarte på forespørsler fra uautoriserte brukere. Det finnes også påstander om at andre uutgitte antropiske modeller var tilgjengelige ved hjelp av samme tilnærming, selv om detaljer om disse systemene fortsatt er knappe.

Hva gruppen hevder den gjorde med Mythos

Offentlig har Discord-deltakerne forsøkt å distansere seg fra ideen om at de er nettkriminelle. Et medlem sitert i dekningen av episoden sa at gruppens interesse ligger i å prøve ut nye AI-modeller i stedet for å iverksette angrepEtter deres fortelling ble Mythos brukt til relativt godartede eksperimenter, som å generere enkle nettsteder og teste ledetekster.

De antyder også at de unngikk høyrisikoatferd som kunne utløse alarmer i Anthropics overvåkingssystemer. Gruppen skal angivelig ha avstått fra åpenbart ondsinnede spørringer og fra aktivitetsvolumer som ville skille seg ut, og siktet i stedet mot å «Fly under radaren» mens du utforsker modellens evnerUt fra den tilgjengelige rapporteringen finnes det så langt ingen konkrete bevis for at gruppen brukte Mythos til å kompromittere virkelige mål.

Selv om disse selvbeskrivelsene er nøyaktige, har hendelsen skapt uro blant sikkerhetspersonell. Når en levedyktig vei inn i et begrenset system er påvist, etterlignere kan forsøke å gjenskape teknikken, potensielt med svært forskjellige motiver. Det faktum at denne første bølgen av uautoriserte brukere hevder ikke-ondsinnede hensikter, beroliger lite forsvarere som tenker på hva som kommer etterpå.

Episoden har også fremhevet hvor mye sensitiv tilgang kan avhenge av oppførselen til et lite antall individer. En enkelt kontraktør med delvise rettigheter og en vilje til å bøye regler, kombinert med en viss utholdenhet på en privat Discord-plattform, var tilsynelatende nok til å bryte den tiltenkte isolasjonen av en høyrisiko-AI-modell.

Anthropics respons og leverandørkjedeproblemet

Anthropic har bekreftet rapportene og sier at de gjennomfører en formell gjennomgang. I en uttalelse delt med pressen bemerket selskapet: «Vi etterforsker en rapport som hevder uautorisert tilgang til Claude Mythos-forhåndsvisningen gjennom et av våre tredjepartsleverandørmiljøer.» Ordlyden er forsiktig, men betydningsfull.

Selskapet understreker at det på dette stadiet har ingen bevis for at aktiviteten utvidet seg til kjernesystemene i selskapet eller at den interne infrastrukturen ble direkte kompromittert. Ved å fremstille problemet som begrenset til et leverandørmiljø, trekker Anthropic effektivt en grense mellom sin sentrale drift og miljøet som brukes av leverandøren som er knyttet til Discord-gruppen.

Det er imidlertid nettopp dette skillet som bekymrer mange observatører. Hvis Mythos kan nås fra et tredjepartsmiljø, da Sikkerhetsposisjonen til hver eksterne partner blir en del av angrepsflatenSituasjonen illustrerer en klassisk risiko i forsyningskjeden: selv om et selskap styrker sine egne nettverk, kan svakheter eller feilkonfigurasjoner blant leverandører åpne uventede dører.

Hendelsen kolliderer også med hvordan Project Glasswing ble markedsført. Programmets logikk var at strengt begrense tilgangen til en håndplukket liste over organisasjoner ville holde Mythos unna motstandere, samtidig som det fortsatt tillot nyttig testing og tilbakemeldinger. Ideen om eksklusivitet var sentral: bare store, kontrollerte enheter ville få teste modellen, noe som reduserte sjansen for misbruk.

Hvis en uformell Discord-gruppe kunne begynne å bruke Mythos samme dag som den ble annonsert, ville den fortellingen blitt vanskeligere å opprettholde. Selv om det fortsatt ikke er tegn til angrep fra den virkelige verden som kan spores tilbake til modellen, antyder episoden. Omkretsen rundt sensitive AI-systemer kan være mer sårbar enn tiltenkt, spesielt når eksterne entreprenører og partnere er involvert.

Bredere bekymringer rundt «for kraftig» cybersikkerhets-AI

Utover de spesifikke detaljene i denne saken, bidrar Mythos-historien til en bredere samtale om AI-verktøy som visker ut grensen mellom forsvar og angrepMythos har blitt promotert som et slags «rødt lag i en boks», i stand til å simulere komplekse angripere og avdekke svakheter lenge før menneskelige motstandere snubler over dem.

Sikkerhetsforskere er uenige om hvordan de skal tolke denne presentasjonen. Noen er skeptiske til at et AI-system, uansett hvor avansert det er, pålitelig kan oppdage nye sårbarheter i det tempoet som antydes i markedsføringsmateriell. Andre hevder at selv om påstandene er delvis nøyaktige, vil risikoen for AI-assisterte cyberangrep blir raskere, billigere og mer skalerbare er noe politikere må ta hensyn til i reguleringen.

Kommentarer fra bransjefolk, inkludert ledere i skysikkerhetsfirmaer, gjenspeiler en blanding av nysgjerrighet og bekymring. På den ene siden ser forsvarerne en mulighet til å automatisere kjedelig analyse og stresstesting av programvare under realistiske angrepsscenarierPå den andre siden forestiller de seg hva som skjer hvis lignende modeller bevisst blir innstilt for angrep og distribuert i større grad, eller hvis autovern som er ment å forhindre skadelig bruk viser seg å være enkle å omgå.

Myndighetene begynner å behandle disse spørsmålene som strategiske snarere enn rent tekniske. Anthropic har angivelig blitt utpekt som en «forsyningskjederisiko» fra det amerikanske forsvarsdepartementet, med pågående diskusjoner om hva denne merkingen bør innebære og om den kan revideres. Internasjonale sikkerhetsorganer ser også på systemer som Mythos som testtilfeller for hvordan man skal håndtere AI-teknologier med dobbelt bruk.

Hendelsen med Discord-tilgang kommer derfor på et delikat tidspunkt. For regulatorer kan det tjene som et tidlig eksempel på utfordringene i politiets arbeid med å avgjøre hvem som får bruke kraftige AI-modeller, hvordan tilgangen deres revideres og hvilke forpliktelser leverandører har når ting går galt. For selskaper som vurderer lignende verktøy, reiser det praktiske spørsmål om dokumentasjon, logging og segregering av sensitive miljøer.

Hva dette betyr for selskaper, brukere og AI-styring

For organisasjoner som hadde sett på Mythos eller sammenlignbare systemer, vil episoden sannsynligvis føre til nye risikovurderinger. Kjernespenningen er enkel: De samme egenskapene som gjør en modell attraktiv for forsvar, kan gjøre den farlig hvis den håndteres feil.Hvis selv begrensede forhåndsvisninger kan lekke inn i uformelle miljøer, kan det hende at antagelser om hvem som faktisk bruker disse verktøyene må oppdateres.

Fra et bedriftssikkerhetsperspektiv understreker saken behovet for å granske hele tilgangskjeden, inkludert entreprenører og mindre leverandører og produksjonsdistribusjon av AI-agentteamRetningslinjer som ser robuste ut på papiret, kan rakne i virkelige omgivelser der folk gjenbruker legitimasjon, tar snarveier for enkelhets skyld eller behandler forhåndsvisningsmiljøer som mindre viktige. Organisasjoner kan bestemme seg for at de trenger strengere segmentering for AI-systemer som samhandler direkte med livekode og infrastruktur.

For vanlige brukere og ansatte er historien en påminnelse om at AI ikke bare er enda et stykke bedriftsprogramvare. Systemer som Mythos kan komprimer tiden og ekspertisen som kreves for å undersøke svakheter, noe som forsterker virkningen av enhver lekkasje eller misbruk. Denne virkeligheten kan føre til nye interne opplærings- og styringsrammeverk rundt hvem som kan spørre om høyrisikomodeller og under hvilke forhold.

På fronten av AI-styring er det et økende press for å gå utover frivillige retningslinjer. Hendelser som denne gir næring til behovene formelle standarder for tilgangskontroll, hendelsesrapportering og uavhengig revisjon for de mest kapable modellene. Enten beslutningstakere velger lett tilsyn eller strengere regulering, vil de sannsynligvis peke på tilfeller der begrensede verktøy gled inn i uoffisielle kanaler som begrunnelse.

For Anthropic selv avhenger mye av hva den pågående etterforskningen avdekker: hvordan tilgangsveien fungerte i detalj, hvor mange personer som var involvert, og hvilke tekniske eller prosedyremessige endringer som implementeres etterpå. Uansett utfall har Mythos-episoden allerede blitt et referansepunkt i diskusjoner om hvordan man kan holde avansert cybersikkerhets-AI begrenset til rollene skaperne hadde til hensikt, og hva som skjer når denne innesperringen settes under press.

Når man setter alle disse trådene sammen, fremhever den påståtte uautoriserte Discord-tilgangen til Claude Mythos hvor raskt banebrytende AI kan gli utover de pene grensene som er trukket i lanseringskunngjøringer, avdekke hull i leverandørsikkerhet, teste robustheten til løfter om «kun invitasjon» og tvinge selskaper, regulatorer og brukere til å revurdere hvordan de administrerer verktøy som både kan støtte opp om og potensielt undergrave det digitale forsvaret de er avhengige av.

diseño y construcción de equipos de agentes de ia
Relatert artikkel:
Diseño y construcción de equipos de agentes de IA: de la estrategia a la puesta en producción
Relaterte innlegg: