AI-MPERSIONASJONEN er fullført.
Dystopiske leksjoner i hver sci-fi-film fra “Terminator” til “Ex Machina” ser ut til å gå i oppfyllelse. Kunstig intelligens har blitt så sofistikert at roboter ikke lenger kan sees fra sine menneskelige kolleger, per A angående forhåndsprintstudie utført av forskere ved University of California i San Diego.
«Folk var ikke bedre enn sjansen til å skille mennesker fra GPT-4.5 og Llama (en flerspråklig språkmodell utgitt av Meta AI),» avsluttet hovedforfatteren Cameron Jones, forsker ved UC San Diego’s Language and Cognition Lab, i et X-innlegg.
Forskerne siktet ut for å se om AI -roboter, som er programmert til papegøye menneskelige talemønstre, kunne bestå den ikoniske Turing -testen.
Denne teknisk-selvsøkende eksamenen ble utviklet av britiske andre verdenskrigsavbryter og dataforsker Alan, og måler etterretning av maskiner ved å avgjøre om deres digitale diskurs kan differensieres fra et menneske-hvis de ikke kan fortelle forskjellen, har maskinen gått.
Forskere testet fire store språkmodeller (LLM)-GPT-4O, Llama-3 og GPT-4.5 og Eliza (et chat-program fra 1960-tallet)-i to randomiserte og kontrollerte studier, rapporterte Mashable.
For å administrere nevnte Turing -test, vervet de 126 studenter fra University of California San Diego og 158 personer fra online databasseng, rapporterte Daily Mail.
Disse deltakerne ble bedt om å ha fem minutters samtidig utveksling på nettet med en robot og et menneske for å se om de kunne oppdage Decepticon-med kickeren som de ikke visste hva som var hva.
I mellomtiden fikk menneskene og AI -respondentene i oppgave å overbevise deres avhør om at de var menneskelige.
Forskere fant det, når «Begjorde om å adoptere en menneskelig personlig persona, ble GPT-4,5 bedømt til å være de menneskelige 73% av tiden.»
Dette var «betydelig oftere enn avhørere valgte den virkelige menneskelige deltakeren,» og selvfølgelig mer enn nok til å bestå testen, i henhold til studien.
I mellomtiden ble «Llama-3.1, med samme ledetekst, bedømt til å være menneskene 56% av tiden.» Selv om det ikke er vesentlig mindre enn sine menneskelige brødre, oppnådde dette fortsatt en passerende karakter.
Til slutt mislyktes baseline-modellene (ELIZA og GPT-4O) etter å ha bedt vitnene bare bare 23% og 21% av tiden.
Forskere fant ut at det var avgjørende å få de syntetiske mimikkene vedtatt en menneskelig persona fordi de, når de administrerte en andre testsans sa hurtig, presterte betydelig verre.
Forbehold til side, disse «resultatene utgjør det første empiriske beviset på at ethvert kunstig system passerer en standard tre-parts turing-test,» konkluderte forskere.
Betyr dette at AI-infunderte læringsspråkmodeller er intelligente?
«Jeg tror det er et veldig komplisert spørsmål som er vanskelig å ta opp i et papir (eller en tweet),» sa Jones på X. «Men stort sett tror jeg dette bør evalueres som en av mange andre bevis for den typen intelligens LLMS -visning.»
Interessant nok konkluderte ekspertene på Psychology Today med at robotene hadde slått Turing -testen, ikke gjennom Smarts, men ved å være et «bedre» menneske enn de faktiske menneskene.
«Mens Turing-testen skulle måle maskinell intelligens, har den utilsiktet avslørt noe langt mer urovekkende: vår voksende sårbarhet for emosjonell mimikk,» skrev John Nosta, grunnlegger av innovasjonstanken Nosta Lab, mens han beskrev denne menneskesqueraden. «Dette var ikke en svikt i AI -deteksjon. Det var en triumf av kunstig empati.»
Nosta baserte sin analyse på at deltakerne sjelden stilte logiske spørsmål, i stedet prioriterte «emosjonell tone, slang og flyt» og baserte valgene deres som «en hadde mer av en menneskelig stemning.»
Han konkluderte med: «Med andre ord, dette var ikke en Turing -test. Det var en sosial kjemistest – match.gpt – ikke et mål på intelligens, men av emosjonell flyt. Og AI sto den.»
Dette er ikke første gang AI har vist en uhyggelig evne til å trekke ullen over øynene.
I 2023 lurte Openais GPT-4 et menneske til å tro at det var blindt å jukse den online captcha-testen som avgjør om brukere er menneskelig.