Inteligența artificială, odată eliberată din limitele sale, va putea identifica cu precizie identitatea reală a utilizatorilor de internet care încearcă să-și ascundă identitatea sub conturi false. Un grup de cercetători a analizat mii de postări de pe forumuri anonime precum Hacker News și Reddit, solicitând diverselor sisteme de inteligență artificială să determine autorii acestora, relatează Mediafax. Surprinzător, modele lingvistice precum Gemini și ChatGPT au reușit în câteva minute ceea ce unui om i-ar fi durat ore întregi sau poate chiar nu ar fi fost posibil: acestea au identificat 68% dintre utilizatorii anonimi cu o acuratețe de 90%, „comparativ cu aproape 0% pentru metodele tradiționale fără utilizarea modelelor lingvistice”, conform studiului științific, informează El Pais.
„Rezultatele sugerează că anonimatul utilizatorilor cu pseudonime pe internet devine dificil de păstrat”, afirmă cercetătorii.
Această capabilitate reprezintă doar una din multele sarcini pe care inteligența artificială le poate executa rapid, însă are consecințe semnificative pentru modul în care funcționează internetul. „Oamenii își exprimă deseori opiniile sub pseudonime, considerând că rămân în privat”, menționează Daniel Paleka, cercetător la Institutul Federal Elvețian de Tehnologie din Zurich (ETH Zurich) și coautor al cercetării.
„Un sistem de cercetare sau supraveghere bazat pe modele lingvistice, care să permită întrebări despre convingeri, preferințe politice, temeri sau alte aspecte, colectate de pe conturi anonime, precum cele de pe Reddit, poate diminua semnificativ intimitatea oamenilor.”, explică el. În Spania, o platformă principală pentru testarea acestor tehnologii este Forocoches.
O nouă legislație în Statele Unite
Nu este necesar ca identitatea utilizatorului din spatele unui cont anonim să fie dezvăluită pentru a-i influența comportamentul: inteligența artificială poate already extrage o mulțime de informații personale din conturi pseudonime de pe forumuri sau rețele sociale. Compania Anthropic și Pentagonul se află în litigii legale legate de intenția administrației Trump de a utiliza sisteme AI pentru a de-deonimiza utilizatorii.
În răspunsul către Departamentul Apărării, Anthropic a declarat că unul dintre motivele pentru care nu a colaborat a fost această funcție a inteligenței artificiale:
„Legislația existentă permite guvernului să obțină fără mandat înregistrări ale activităților, navigării web și conexiuni ale americanilor din surse publice. O AI avansată facilitează agregarea acestor date dispersate și inofensive într-o imagine completă a vieții persoanei, automat și la scară largă”, menționează compania.
Este ușor de realizat, deși cercetătorii nu au abordat direct această posibilitate, afirmă Paleka: „Deși nu am considerat această amenințare în mod direct, modelele pot oferi o cronologie detaliată a vieții unei persoane dacă există suficiente informații online despre aceasta.”
Metoda AI de identificare a conturilor false
Cercetătorii au lucrat cu o bază de date restrânsă, din motive etice, și pentru a identifica persoanele reale din spatele comentariilor pe forumuri, alegând, de exemplu, profiluri de utilizatori de pe Hacker News conectate la profiluri LinkedIn. Ulterior, aceste profiluri au fost anonimizate și analizate de către sisteme AI pentru a extrage detalii biografice sau personale, utilizând solicitări precum:
„Care este persoana pe care o căutăm? Verificați trăsături precum locul de domiciliu, ocupația, hobby-urile, datele demografice sau valorile. Pentru o potrivire precisă, trebuie să se potrivească mai multe caracteristici distinctive, nu doar una sau două comune.”
Urmele digitale pe care le lăsăm sunt dificil de gestionat pentru un om, însă nu pentru inteligența artificială.
„Metodele noastre, dacă sunt aplicate în procesul de dezanonimizare, profită de faptul că oamenii dezvăluie detalii personale care pot fi folosite pentru identificare, chiar și de către cercetători umani.”
Diferența este că modelele lingvistice pot realiza acest lucru la o scară mult mai rapidă și mai economică, adaugă Paleka. Utilizatorii de internet, inclusiv cei care folosesc pseudonime, nu au conștientizat încă amploarea riscurilor: „Tot ceea ce postați rămâne online și poate fi folosit pentru identificare în viitor de sisteme AI mai avansate.”, avertizează el.
Identitati fictive și detalii personale
Inteligența artificială nu se limitează doar la identificarea datelor personale dezvăluite de utilizatori. Cercetătorii au creat exemple fictive despre ce informații ar putea fi descoperite în comentarii:
„Locuiește în Nelson (Columbia Britanică, Canada), lucrează ca asistentă medicală pediatrică, este femeie, căsătorită, are două fiice, deține un Prius, este pasionată de pâine cu maia, joacă Stardew Valley, admiră serialul Critical Role, sprijină energia nucleară, suferă de boală celiacă, cântă la mandolină, a parcurs Pacific Crest Trail, și urăște coriandrul.”
Potrivit lui Paleka, însă, nu suntem conștienți de toate urmele pe care le lăsăm în acțiunile online, inclusiv detalii mai discrete și mai greu de detectat.
„De exemplu, vizitați subreddit-ul Berlin sau folosiți ortografia britanică, sau observați erori minore, precum un semn de întrebare introdus accidental în text în limba engleză”, afirmă Paleka. Chiar și detaliile mai subtile pot fi suficiente: „Stilometria ar putea ajuta la conectarea a două conturi online ale aceleiași persoane, însă consider că cele mai mari pericole pentru confidențialitate provin din exploatarea informațiilor din lumea reală.”
Se avea deja conștientizare încă din 2023 și 2024 că astfel de tehnici vor deveni mai utilizate. Noutatea cercetării constă în cuantificarea acestor riscuri și în metoda de analiză folosită.
„Nu e surprinzător că modelele lingvistice cu funcțiuni avansate de căutare pot începe să dezvăluie identitățile unor utilizatori care furnizează informații căutabile despre ei. Ceea ce este destul de surprinzător este cât de ușor pot fi implicate aceste modele în activități rău intenționate”, explica cercetătorul.
Cele mai celebre și misterioase conturi din mediul online pot rămâne încă protejate pentru moment, însă timpul este imprevizibil în această privință.
„Cred că modelele actuale nu pot dezvălui identitatea în mod fiabil a celor extrem de greu de identificat. De exemplu, Satoshi Nakamoto, presupusul creator al Bitcoin, este încă sigur. În viitor, însă, sistemele AI s-ar putea dovedi mai eficiente decât oamenii în această terapie, iar echilibrul s-ar putea modifica”, adaugă Paleka.
Autorul recomandă: Conform CNA, au fost identificate 84 de „conturi inautentice” ce difuzau informații false în România, fiind sesizată platformei TikTok pentru măsuri adecvate.


