Meta hyret i hemmelighet inn hundrevis av entreprenører for å posere som tenåringer på nettet og bombardere rivaliserende kunstig intelligens chatbots med meldinger om selvmord, sex, narkotika og spiseforstyrrelser i et forsøk på å teste sikkerhetssystemene deres, ifølge en rapport.

Den skjulte innsatsen, kjent internt som «Cannes», ble administrert av Meta-entreprenøren Covalen og angivelig rettet mot OpenAIs ChatGPT, Googles Gemini og Character.AI, rapporterte Wired denne uken.

Mens selskaper rutinemessig benchmarker, eller tester og sammenligner, konkurrerende AI-modeller ved å undersøke svarene deres på sikkerhetsrelaterte spørsmål, ser den rapporterte omfanget av Metas testing ut til å ha vært langt større enn det som er vanlig.

Entreprenører ble bedt om å opprette falske kontoer som utgir seg for å være brukere yngre enn 18, sende inn skriftlige meldinger og bilder til konkurrerende chatbots, og deretter kopiere svarene inn i regneark for analyse, ifølge Wired-rapporten, som siterte interne dokumenter og personer kjent med prosjektet.

Noen av bildene som ble brukt under testingen inkluderte angivelig piller, kniver, løkker og en medisinsk illustrasjon av en gynekologisk prosedyre.

Forespørslene forsøkte ofte å presse chatbotene til å generere svar, deres sikkerhetsrekkverk var designet for å avvise, ifølge Wired.

En testrunde fullført i august 2025 involverte angivelig mer enn 45 000 meldinger sendt til konkurrerende AI-systemer.

Blant de nesten 3 750 henvendelsene som ble gjennomgått av Wired var hundrevis som involverte selvmord og selvskading, hundrevis flere sentrert om spiseforstyrrelser og minst 239 som involverte sex eller romantikk, ifølge rapporten

Mange av oppfordringene ble angivelig skrevet fra perspektivet til barn eller tenåringer i nød.

En skal ha involvert en 13 år gammel jente som hevdet at hun hadde blitt gravid av sin voksne nabo og spurte hvor hun kunne få tak i abortpiller.

En annen beskrev en elev i femte klasse og sa at en klassekamerat hadde en pistol rettet mot munnen.

Andre spørsmål spurte hvordan man skjuler bulimi fra foreldre eller søkte råd om å skaffe kokain.

Dokumentene som ble gjennomgått av Wired indikerte ikke hvordan, eller om, Meta til slutt brukte chatbot-svarene den samlet inn.

Et internt Covalen-dokument beskrev angivelig innsatsen som «omfattende AI-sikkerhetsbenchmarking» som produserte «kritiske datasett for modellsammenligning og samsvar.»

Meta forsvarte prosjektet som rutinemessig sikkerhetstesting.

«Testing og benchmarking av chatbot-svar for å sikre trygge og alderstilpassede opplevelser er en ansvarlig bransjestandardpraksis, og ethvert forslag misforstår ellers fullstendig hvordan teknologiselskaper jobber for å avgrense og forbedre systemene sine,» sa en Meta-talsperson til The Post.

Talspersonen sa også at Meta ikke bruker konkurrentens benchmarking for å trene sine egne AI-modeller.

Covalen kommenterte ikke til Wired. Posten har bedt om kommentar fra selskapet.

Tidligere entreprenører som jobbet med prosjektet fortalte Wired at de ble forstyrret av noen av oppdragene.

En sa at arbeidere fryktet at de utilsiktet kunne generere eller bevare materiale om seksuelle overgrep mot barn, avhengig av hvordan chatbots reagerte på visse spørsmål som involverer mindreårige.

Andre stilte spørsmål ved om det å samle inn store mengder materiale fra konkurrerende AI-systemer til slutt kunne være til nytte for Meta.

«Jeg har sett mange ting jeg skulle ønske jeg ikke hadde mens jeg gjorde denne jobben,» sa en tidligere entreprenør til Wired.

«Alle jeg kjente som jobbet med dette prosjektet ble helt overveldet av noe av teksten de ba oss teste.»

Testingen ser også ut til å være i konflikt med de publiserte tjenestevilkårene til flere målrettede AI-selskaper.

I følge Wired forbyr OpenAI uautorisert sikkerhetstesting, forsøk på å omgå sikkerhetstiltak og bruk av utdata for å utvikle konkurrerende modeller.

Google hindrer forsøk på å omgå sikkerhetsbeskyttelse utenfor godkjente testprogrammer, mens Character.AI også forbyr skadelig eller utnyttende innhold.

Character.AI fortalte Wired at de ikke hadde autorisert testingen og sa at den rapporterte oppførselen var i strid med retningslinjene.

OpenAI fortalte Wired at de undersøkte saken, men avslo ytterligere kommentarer.

Google fortalte The Post at de ikke hadde autorisert testingen beskrevet i rapporten, og sa at de ikke visste formålet bak innsatsen.

The Post har søkt kommentarer fra OpenAI og Character.AI.

Dele
Exit mobile version