
„Amazon“ debesų padalinys pradėjo tyrimą dėl „Perplexity AI“. Kyla klausimas, ar AI paieškos paleidimas pažeidžia pažeidimus „Amazon“ žiniatinklio paslaugos WIRED sužinojo, kad taisyklės pašalinamos iš interneto svetainių, kurios bandė to neleisti.
AWS atstovas, kalbėjęs su WIRED su sąlyga, kad jie nebus įvardinti, patvirtino bendrovės „Perplexity“ tyrimą. WIRED anksčiau buvo surastas kad startuolis – kuris turi atrama iš Jeffo Bezoso šeimos fondo ir „Nvidia“ ir buvo neseniai vertinamas 3 milijardai dolerių – panašu, kad remiamasi turiniu iš nukopijuotų svetainių, kurioms buvo uždrausta prieiga per Robots Exclusion Protocol – įprastą žiniatinklio standartą. Nors Robotų pašalinimo protokolas nėra teisiškai privalomas, paslaugų teikimo sąlygos paprastai yra.
Robotų pašalinimo protokolas yra dešimtmečių senumo žiniatinklio standartas, apimantis paprasto teksto failo (pvz., wired.com/robots.txt) įdėjimą į domeną, kad būtų nurodyta, kurių puslapių neturėtų pasiekti automatiniai robotai ir tikrinimo programos. Nors įmonės, kurios naudoja grandiklius, gali nepaisyti šio protokolo, dauguma tradiciškai jo laikosi. „Amazon“ atstovas WIRED sakė, kad AWS klientai, tikrindami svetaines, turi laikytis robots.txt standarto.
„AWS paslaugų teikimo sąlygos draudžia klientams naudotis mūsų paslaugomis bet kokiai neteisėtai veiklai, o mūsų klientai yra atsakingi už mūsų sąlygų ir visų taikomų įstatymų laikymąsi“, – sakoma atstovo pranešime.
Toliau nagrinėjama „Perplexity“ praktika birželio 11 dienos „Forbes“ reportaže kuris apkaltino startuolį pavogęs bent vieną jos gaminį. WIRED tyrimai patvirtino šią praktiką ir rado papildomų įrodymų draskymo piktnaudžiavimas ir plagiatas sistemos, susietos su „Perplexity“ AI varomu paieškos pokalbių robotu. „Condé Nast“, pagrindinės WIRED įmonės, inžinieriai blokuoja „Perplexity“ tikrinimo programą visose jos svetainėse naudodami robots.txt failą. Tačiau WIRED nustatė, kad bendrovė turėjo prieigą prie serverio, naudodama nepaskelbtą IP adresą – 44.221.181.252, kuris per pastaruosius tris mėnesius apsilankė „Condé Nast“ patalpose mažiausiai šimtus kartų, matyt, norėdamas iškrapštyti „Condé Nast“ svetaines.
Panašu, kad su Perplexity susijusi mašina užsiima plačiai paplitusiu naujienų svetainių tikrinimu, draudžiančiu robotams pasiekti jų turinį. „The Guardian“, „Forbes“ ir „The New York Times“ atstovai taip pat teigia aptikę IP adresą nuolat besilankant jų serveriuose.
WIRED atsekė IP adresą į virtualią mašiną, žinomą kaip Elastic Compute Cloud (EC2) egzempliorius, priglobtas AWS, kuris pradėjo tyrimą po to, kai paklausėme, ar AWS infrastruktūros naudojimas tinklalapiams, kurie tai draudžia, išgryninti, nepažeidžia bendrovės paslaugų teikimo sąlygų.
Praėjusią savaitę „Perplexity“ generalinis direktorius Aravindas Srinivasas pirmiausia atsakė į WIRED tyrimą sakydamas, kad klausimai, kuriuos mes uždavėme įmonei, „atspindi gilų ir esminį nesusipratimą, kaip veikia Perplexity ir internetas“. Tada Srinivas pasakojo „Fast Company“. kad slaptas IP adresas WIRED stebėjo, kaip nubraukė „Condé Nast“ svetaines, o mūsų sukurta bandomoji svetainė buvo valdoma trečiosios šalies įmonės, teikiančios žiniatinklio tikrinimo ir indeksavimo paslaugas. Jis atsisakė nurodyti bendrovės pavadinimą, motyvuodamas neatskleidimo susitarimu. Paklaustas, ar lieptų trečiajai šaliai nustoti tikrinti WIRED, Srinivas atsakė: „Tai sudėtinga“.