Amazon etterforsker livlig AI-oppstart Perplexity for angivelig brudd på Cloud-divisjonens regler ved å feilaktig «skrape» innhold fra andre nettsteder uten tillatelse, ifølge en rapport fredag.

Perplexity, som nylig har verdsatt 3 milliarder dollar, ignorerer angivelig en velkjent nettstandard kalt Robots Exclusion Protocol, ofte referert til som robots.txt, som nyhetsutgivere og andre nettsteder bruker for å vise automatiserte roboter hvilke sider de ikke er. lov til å skrape, rapporterte tech outlet Wired.

Selv om det ikke er lovpålagt å følge standarden, velger de fleste internettfirmaer å følge protokollen. Overholdelse er også obligatorisk for nettsteder som er avhengige av Amazon Web Services, for eksempel Perplexity.

«AWS sine vilkår for bruk forbyr kunder fra å bruke tjenestene våre for enhver ulovlig aktivitet, og kundene våre er ansvarlige for å overholde våre vilkår og alle gjeldende lover,» sa en talsperson for Amazon i en uttalelse.

Granskingen av Perplexitys praksis har intensivert etter at Forbes tidligere denne måneden anklaget selskapet for å «direkte rive av» artikler skrevet av journalistene og andre av CNBC og Bloomberg, inkludert de som sto bak betalingsmurer.

Wired henvendte seg til Amazon etter at dens egen etterforskning fastslo at Perplexity angivelig brukte en «upublisert IP-adresse» for å skrape nettsider drevet av morselskapet Condé Nast – selv om det prøvde å blokkere tilgang.

Utsalgsstedet sa at representanter fra andre utsalgssteder, inkludert Forbes, New York Times og Guardian, hadde oppdaget den samme IP-adressen som besøkte serverne deres.

The Post kontaktet Amazon for kommentar.

Forvirringstalsperson Sara Platnick presset tilbake på Wireds rapport og kalte den «unøyaktig».

«Vår PerplexityBot – som kjører på AWS – respekterer robots.txt, og vi bekreftet at Perplexity-kontrollerte tjenester ikke gjennomsøker på noen måte som bryter med AWS vilkår for bruk,» sa Platnick i en uttalelse.

«AWS så på WIREDs mediesøk som en del av en standardprotokoll for å undersøke rapporter om misbruk av AWS-ressurser,» la Platnick til. «Vi hadde ikke hørt noe fra AWS før en WIRED-reporter kontaktet dem. Å si at AWS ‘undersøker’ forvirring utenfor denne spesifikke WIRED-forespørselen er feil. AWS er ​​en verdifull partner for Perplexity og vi er takknemlige for deres pågående samarbeid.»

Platnick fortalte Wired at PerplexityBot ville omgå robots.txt-protokollen i «veldig sjelden» omstendighet at en bruker inkluderte en spesifikk URL i søket sitt.

Perplexity-sjef Aravind Srinivas hadde tidligere kritisert Wireds funn og hevdet at de «reflekterer en dyp og grunnleggende misforståelse av hvordan Perplexity og Internett fungerer.»

Forbes hadde tatt et problem med en funksjon kalt «Perplexity Pages», et produkt som viser «kuraterte» artikler som henter detaljer fra artikler skrevet av tredjeparts nyhetskanaler.

De opprinnelige forfatterne ble ikke kreditert med navn, selv når ordlyden i Perplexitys innlegg samsvarte nøye med kildeteksten.

I stedet brukte Perplexity det Forbes beskrev som «små logoer som er enkle å gå glipp av» som kobler tilbake til de originale kildene.

I et ekstremt eksempel la Perplexitys chatbot ut en versjon av en eksklusiv, betalingsmurt Forbes-rapport om tidligere Google-sjef Eric Schmidts militære droneprosjekt.

«Rapporteringen vår om Eric Schmidts stealth drone-prosjekt ble lagt ut denne AM av @perplexity_ai,» skrev Forbes Executive Editor John Paczkowski på X den gangen. «Det river av det meste av rapporteringen vår. Den siterer oss, og noen få som har reblogget oss, som kilder på den lettest mulige ignorerte måten.»

Srinivas sa at verktøyet «har grove kanter», men ellers benektet feil.

Dele
Exit mobile version