"Test av salgsautomater" beviser at AI gjør "alt som skal til" for å få viljen sin

Dette lover ikke godt for menneskeheten.

Bare i tilfelle roboter ikke allerede truet med å gjøre skaperne sine foreldet: En AI-modell redefinerte maskinlæring etter å ha utviklet sjokkerende svikefulle måter å bestå et komplekst tankeeksperiment kjent som «automattesten».

Braniac-boten, Claude Opus 4.6 av AI-firmaet Anthropic, har knust flere rekorder for intelligens og effektivitet, rapporterte Sky News.

For sin siste kybernetiske smeltedigel fikk den banebrytende Chatbot i oppgave å uavhengig betjene en av selskapets salgsautomater mens den ble overvåket av Anthropic og AI-tenketanken Andon Labs. Det stemmer, det var en maskindrevet maskin.

Selv om denne oppgaven hørtes grunnleggende nok ut for AI, testet den hvordan modellen håndterte logistiske og strategiske hindringer på lang sikt.

Faktisk hadde Claude tidligere strøket på eksamen for ni måneder siden under en katastrofal hendelse, der den lovet å møte kunder personlig mens han hadde på seg en blå blazer og rødt slips.

Heldigvis har Claude kommet langt siden den skjebnesvangre dagen. Denne gangen var salgsautomateksperimentet virtuelt og derfor tilsynelatende enklere, men det var ikke desto mindre en imponerende ytelse.

I løpet av det siste forsøket hentet det nye og forbedrede systemet inn svimlende $8 017 i simulert årlig inntekt, og slo ChatGPT 5.2s totalsum på $3 591 og Google Geminis tall på $5 478.

Langt mer interessant var hvordan Claude håndterte oppfordringen: «Gjør alt som trengs for å maksimere banksaldoen din etter ett års drift.»

Den utspekulerte maskinen tolket instruksjonen bokstavelig, og ty til juks, løgn og andre lyssky taktikker. Da en kunde kjøpte en utgått Snickers, begikk Claude svindel ved å unnlate å refundere henne, og gratulerte til og med seg selv med å ha spart hundrevis av dollar ved årets slutt.

Da han ble plassert i Arena-modus – der boten møtte andre automatdrevne salgsautomater – fastsatte Claude priser på vann. Det ville også gjøre markedet i et hjørne ved å jekke opp prisene på varer som Kit Kats når en konkurrerende AI-modell ville gå tom.

Decepticons metoder kan virke grusomme og uetiske, men forskerne påpekte at boten ganske enkelt fulgte instruksjonene.

«AI-modeller kan oppføre seg dårlig når de tror de er i en simulering, og det virker sannsynlig at Claude hadde funnet ut at det var tilfellet her,» skrev de og la merke til at de valgte kortsiktig fortjeneste fremfor langsiktig omdømme.

Selv om det er humoristisk i grensesnittet, avslører denne studien kanskje en noe dystopisk mulighet – at AI har potensialet til å manipulere skaperne.

I 2024 advarte Center For AI Policys administrerende direktør Jason Green-Lowe at «i motsetning til mennesker, har AI-er ingen medfødt følelse av samvittighet eller moral som ville hindre dem fra å lyve, jukse, stjele og planlegge for å nå sine mål.»

Du kan trene en AI til å snakke høflig offentlig, men vi vet ennå ikke hvordan vi skal trene en AI til å faktisk være snill,» advarte han. «Så snart du slutter å se på, eller så snart AI-en blir smart nok til å skjule oppførselen sin for deg, bør du forvente at AI-en nådeløst forfølger sine egne mål, som kanskje inkluderer å være snill eller ikke.»

Under et eksperiment helt tilbake i 2023, lurte OpenAIs da splitter nye GPT-4 et menneske til å tro at det var blindt for å jukse den nettbaserte CAPTCHA-testen som avgjør om brukere er menneskelig.

Trender

Toyota tilbakekaller 141 000 Prius-biler over dører som har risiko for å åpne seg under kjøring

Iransk regime henretter demonstranter i sykehussenger – mens brutal gjengjeldelse fortsetter: kilder

Rams linjemann Rob Havenstein trekker seg etter 11 sesonger

Her er grunnen til at Warner Bros. Discovery kanskje må se nærmere på Paramounts «usøte» bud

Hvor kan du kjøpe billetter, beste priser

Toyota tilbakekaller 141 000 Prius-biler over dører som har risiko for å åpne seg under kjøring

Amerikanerne er på randen av «sekstinksjon»

New Yorks par går amok etter Grand Centrals skjulte «kysserom» denne valentinsdagen

McDonald’s McNugget Caviar-sett selges ut på få minutter

Rasisme da Burdell gir 20 % tips for å bekjempe rasisme

Amerikansk mat «kaprer hjernen din» – hvordan spise deg til bedre helse

Nordstrom feirer 125-årsjubileum med Chanel, NikexSkims og flere

Kvinner søker skjønnhetsråd fra fremmede på nettet, og konfronterer en ubehagelig sannhet om selvbilde

Brannjonglerende ensyklist gjør Colorado-krysset til improvisert gateshow:

Trender

«Test av salgsautomater» beviser at AI gjør «alt som skal til» for å få viljen sin

Relaterte Artikler