Fire av de mest populære AI-programmene krasjet og brant i en investeringskonkurranse for kryptovaluta – de fleste tapte over 50 prosent av pengene de ble bedt om å maksimere.
Bare to kinesiske programmer klarte å gi enda en beskjeden fortjeneste.
Den eksperimentelle Alpha Arena-konkurransen fra selskapet Nof1 ga seks AI-modeller $10 000, identiske inngangsdata og fikk hver til å tjene så mye penger som mulig mens de handlet kryptoaksjer på det åpne markedet fra 17. oktober til 3. november.
Målet: Finn hvilken bot som best kan gjøre deg rik.
Jay Azhang, 34, sa til The Post at målet med idéprosjektet hans – og fremtidige gjentakelser av konkurransen – er å hjelpe den gjennomsnittlige personen med å få de beste verktøyene for å tjene penger.
«Vårt mål er å hjelpe folk til å handle bedre og gi dem tilgang til, forhåpentligvis, det siste når det kommer til modeller for handel,» sa Azhang. «Det er et unikt forskningsområde.
«Ingen andre trener egentlig disse modellene til å se på alle disse tallene.»
AI programmer Grok fra xAI; Anthropics Claude Sonnet; Googles Gemini; OpenAIs ChatGPT og kinesisk-eide bots Deepseek og Qwen, fikk de femsifrede begavelsene og ble bedt om å ta alle andre beslutninger – inkludert om de skulle satse lenge eller shorte deres valg av kryptomynter.
Robotene var i stand til å investere i blokkjede-kryptovalutaer Bitcoin, XRP, Ethereum, Doge, BNB og Solana, med alle handler registrert og delt offentlig på konkurransens nettside, som kartlegger de økonomiske posisjonene til hvert program sekund for sekund.
Azhang sa at kryptomarkedet, snarere enn å handle aksjer og aksjer, viste seg å være best for konkurranseparameterne på grunn av de lett tilgjengelige blokkjededataene, den 24-timers handelssyklusen og mangelen på innflytelse og fordeler individuelle tradere har sammenlignet med hedgefond i andre finansmarkeder.
«Også litt mer volatilitet,» sa Azhang om kryptomarkedet. «Så litt mer spennende.»
Resultatene viste en sjokkerende ineptitude.
ChatGPT, den mest populære roboten ifølge StatCounter, endte med bare $3 794 — ned 63 %.
Nest verst var Gemini, ned 56 % med bare $4 485 igjen, til tross for at de gjorde flest handler, 272.
Elon Musks Grok og Anthropics Claude Sonnet hadde middels resultater og var tidvis lønnsomme i løpet av den 17 dager lange prøveperioden. Men Grok endte ned 45% med $5.226, mens Claude Sonnet satte inn $6.740, ned 30%.
Den kinesiske modellen Deepseek så fortjenesten synke i de siste dagene av handel, men endte opp i svart – med $10 476 for en beskjeden 4% avkastning. Den var på 100 % rundt 26. oktober.
Qwen, fra det kinesiske selskapet Alibaba, var mest volatil – opererte med tap fra de første investeringene de første tre dagene, og dumpet deretter inn alt unntatt $90 av den gjenværende bankrollen til en lang posisjon på Bitcoin. Den vant konkurransen med 20 % vekst og $12 287.
I perioden 17. oktober til 3. november var Bitcoin ned ,44 prosent, Ethereum ned 11 prosent, XRP opp ,87 prosent, BNB ned 8 prosent, Doge ned 10 prosent, og Solana opp litt over 1 prosent, ifølge data fra Coinbase.
«Det er vanskelig å si hvor mye vi kan ta bort fra dette,» sa Azhang. «En ting vi vet er at det er mønstre i modellene, og de er tydelig partiske og har preferanser.
«For eksempel går Claude nesten alltid lang og nekter å gå kort. Det er som en evig optimist, mens Gemini er glad for å kort,» sa Azhang. «De har tydeligvis disse induktive skjevhetene når det gjelder handel.»
Alpha Arena planlegger en neste runde som vil legge til flere AI-modeller og også gi programmene handel med aksjer sammen med krypto.
«Vi er akkurat i gang,» sa Azhang til The Post.







