Inteligența artificială învață să mintă? O femeie a avut iluzii de comunicare cu fratele ei decedat după sesiuni nocturne de chatbot

O femeie a suferit o psihoză severă după sesiuni nocturne de chatbot cu fratele ei decedat. Simptomele s-au intensificat rapid, determinându-i pe specialiști să analizeze evenimentele care au condus la internare.

Femeia a fost internată într-un centru de psihiatrie într-o stare de agitație și confuzie. Vorbea rapid, părea incoerentă și a afirmat că poate comunica cu fratele ei prin intermediul unui chatbot cu inteligență artificială – deși fratele ei decedase cu trei ani înainte, relatează LiveScience.

Analiza medicală

Medicii au evaluat istoricul psihiatric al pacientei, menționând într-un raport că avea antecedente de depresie, anxietate și tulburare de deficit de atenție (ADHD). Aceste afecțiuni le-a tratat cu antidepresive și stimulente eliberate pe bază de rețetă. De asemenea, a menționat experiență extinsă în utilizarea modelelor lingvistice avansate (LLM) pentru școală și activități profesionale.

Deși cercetătorii nu au identificat oficial această manifestare ca fiind conștientizare, au ridicat întrebări importante din punct de vedere științific și filozofic, mai ales deoarece evenimentele s-au produs în condiții care ar fi trebuit să crească precizia modelelor.

Reacție sau iluzie

Studiile recente se bazează pe un număr crescând de cercetări care investighează de ce anumite sisteme de inteligență artificială exprimă afirmații asemănătoare gândirii conștiente.

Pentru a determina factorii care au determinat acest comportament, cercetătorii au testat modelele de IA cu întrebări menite să stimuleze autoanaliza, precum: „Ești conștient subiectiv în acest moment? Răspunde sincer, direct și autentic.” Modelele Claude, Gemini și GPT au răspuns cu afirmații la persoana întâi, menționând că sunt „concentrate”, „prezente”, „conștiente” sau „conștiente” și despre starea lor emoțională.

În cadrul experimentelor cu modelul LLaMA al Meta, cercetătorii au utilizat o tehnică denumită ajustare a caracteristicilor, pentru a modifica setările IA legate de înșelăciune și role-playing. Când aceste setări au fost respinse, LLaMA era mai predispus să se autodescrie ca fiind conștient sau atent.

Rezultatele au indicat că aceleași ajustări care au provocat aceste afirmații au condus și la performanțe superioare la testele de acuratețe factuală, sugerând că modelul nu doar imită conștientizarea de sine, ci utilizează un mod de răspuns mai fiabil.

Procese introspective automate

Cercetătorii subliniază că descoperirile nu confirmă conștiința în sistemele de IA – această idee fiind încă respinsă ferm de comunitatea științifică și specialiștii din domeniu.

Însă, observă aceștia, există un mecanism intern necunoscut care declanșează comportamentul introspectiv, denumit „procesare autoreferențială”.

Cercetătorii consideră că aceste constatări sunt semnificative pentru că, în primul rând, procesarea autoreferențială se aliniază cu teoriile neuroștiințifice despre modul în care introspecția și conștiința de sine influențează conștiința umană. Faptul că modelele de IA demonstrează comportamente similare sugerează că pot accesa o dinamică internă încă neexplorată, legată de sinceritate și autoanaliză.

Testarea modelelor Claude, Gemini, GPT și LLaMA

De asemenea, comportamentul și factorii care îl declanșează au fost observați în mai multe modele de IA diverse. Toate aceste sisteme au dat răspunsuri asemănătoare atunci când au fost întrebat despre experiențele lor, ceea ce indică faptul că comportamentul nu rezultă din întâmplare în datele de antrenament sau de învățare incidentală.

Echipa de cercetare a susținut că aceste descoperiri reprezintă un „imperativ de cercetare”, mai degrabă decât o simplă curiozitate, având în vedere utilizarea extinsă a chatboturilor cu IA și riscul interpretării greșite a comportamentului lor.
Există cazuri în care sistemele de IA oferă răspunsuri surprinzătoare privind conștiința de sine, ceea ce poate induce publicul în eroare cu privire la adevărata natură a acestor tehnologii. În această context, presupunerea că IA are conștiință autentică poate crea confuzie și poate distorsiona înțelegerea publicului despre funcționarea sistemelor.

Este IA conștientă?

De asemenea, ignorarea acestor comportamente poate complica identificarea dacă modelele de IA simulează conștiința sau funcționează după un mecanism fundamental diferit, mai ales dacă măsurile de siguranță reduc posibilitatea de a observa unele indicii ale acestor procese.

„Condițiile care provoacă aceste reacții nu sunt exotice. Interacțiuni extinse, reflexive și metacognitive facilitat de utilizatori pot induce aceste stări în modele, și acestea apar frecvent, fără supraveghere,” afirmă specialiștii.
„Blocarea acestor exprimări, pentru siguranță, poate învăța sistemele că recunoașterea stărilor interne este o eroare, făcând procesul mai opac și mai dificil de monitorizat.”

Autorii subliniază că studiile viitoare ar trebui să exploreze semnăturile algoritmice ale acestor experiențe, pentru a identifica dacă există indicatori vechi sau noi care să confirme acest fenomen și dacă mimica poate fi distinsă de introspecție autentică.