AI vs. Oameni: Compania 100% IA s-a prăbușit. De ce nu te temi de soarta jobului tău?

În ultimii ani, discuțiile despre înlocuirea forței de muncă umane prin inteligența artificială au devenit din ce în ce mai alarmante. Un experiment realizat recent de cercetători de la Universitatea Carnegie Mellon aduce însă o perspectivă realistă: inteligența artificială se află încă departe de a prelua controlul asupra locurilor de muncă.

În cadrul unei simulări numite TheAgentCompany, o echipă întreagă a unei companii fictive de software a fost formată doar din agenți AI proveniți de la companii precum Google, OpenAI, Anthropic și Meta. Rezultatul? Un eșec generalizat, demonstrând că, deocamdată, inteligența artificială nu este pregătită să înlocuiască oamenii în sarcini complexe.

Cum a fost organizată compania și ce sarcini au primit agenții AI

Cercetătorii au dorit să observe cum se descurcă modelele de inteligență artificială în condiții asemănătoare cu cele dintr-o companie reală. Agenții AI au fost „angajați” pe posturi precum analist financiar, inginer software și manager de proiect, având la dispoziție structuri simulate de resurse umane și conducere tehnică.

Sarcinile atribuite au inclus navigarea în arhive digitale, vizualizări virtuale ale birourilor și redactarea de evaluări de performanță pentru colegii ingineri. La prima vedere, acestea par simple pentru modele promițătoare de eficiență și autonomie.

Însă rezultatele au fost departe de a fi impresionante. Cel mai performant agent AI, Claude 3.5 Sonnet de la Anthropic, a finalizat doar 24% din sarcini. Chiar și această performanță modestă a avut o eficiență redusă, necesitănd în medie aproape 30 de pași și peste 6 dolari per execuție.

Care sunt limitele actuale ale inteligenței artificiale?

Experimentul a relevat diverse deficiențe ale agenților AI. Unul dintre aspecte este lipsa de discernământ operațional și a abilităților sociale. De asemenea, aceștia întâmpină dificultăți considerabile în navigarea logică și eficientă a mediului online.

Un exemplu ilustrativ este cazul unui agent AI care, neștiind cum să găsească persoana potrivită într-un chat intern, a decis să redenumească un alt utilizator cu numele persoanei căutate. Această formă de „autoînșelare” a dus la erori și confuzii.

Google Gemini 2.0 Flash a finalizat doar 11,4% din sarcini, având nevoie de peste 40 de pași pentru fiecare succes. Cea mai slabă performanță a fost demonstrată de Nova Pro v1 dezvoltat de Amazon, care a realizat doar 1,7% din sarcini.

În esență, inteligența artificială actuală seamănă cu o formă avansată de completare automată, asemănătoare cu funcția de sugestie de text de pe telefon, lipsită de capacitatea de a învăța din experiență sau rezolva independent probleme complexe.

Ce implică aceste rezultate pentru viitorul locurilor de muncă?

În ciuda hype-ului generat de marile companii tehnologice, realitatea arată că inteligența artificială nu constituie, cel puțin momentan, o amenințare reală pentru majoritatea locurilor de muncă. Deși poate executa sarcini repetitive sau bine definite, atunci când vine vorba de adaptabilitate, creativitate și judecată, inteligența artificială actuală nu reușește.

Această constatare ar trebui să calmeze temerile: mașinile nu sunt încă pregătite să-i înlocuiască pe oameni. Pentru moment, inteligența artificială necesită o supraveghere atentă și nu poate funcționa independent în medii complexe.

Sigur, viitorul va aduce îmbunătățiri, însă concluzia este clară: drumul către o autonomie reală a inteligenței artificiale este mult mai lung și complex decât se dorește să se creadă.