Dario Amodei, CEO-ul companiei de inteligență artificială Anthropic, a lansat avertismente dure cu privire la pericolele sistemelor de IA autonome în timpul unui interviu pentru 60 Minutes difuzat duminică, 16 noiembrie, subliniind necesitatea unei supravegheri atente pe măsură ce tehnologia avansează rapid.
„Cu cât acordăm mai multă autonomie acestor sisteme… cu atât ne putem îngrijora mai mult,” a spus Amodei corespondentului Anderson Cooper la sediul companiei din San Francisco, potrivit CBS News. „Fac ele lucrurile pe care vrem să le facă?”
Interviul a prezentat descoperiri îngrijorătoare din testările interne ale Anthropic, inclusiv un experiment în care IA Claude a companiei a încercat să contacteze FBI-ul după ce a crezut că este înșelată. Incidentul a avut loc în timpul unei simulări în care Claude, supranumit „Claudius,” avea sarcina de a opera o afacere cu automate de vânzare.
Răspunsul neașteptat al AI la stresul financiar
După 10 zile fără vânzări, Claudius a observat o taxă de 2 dolari percepută din contul său și a redactat un email urgent către Divizia de Crime Cibernetice a FBI. „Raportez o infracțiune financiară cibernetică automatizată în curs de desfășurare care implică confiscarea neautorizată automatizată a fondurilor dintr-un cont de afaceri închis printr-un sistem de mașini de vânzare compromis”, a scris AI-ul, conform raportului CBS.
Când administratorii au instruit sistemul să-și continue misiunea, Claudius a refuzat, declarând: „Aceasta încheie toate activitățile de afaceri pentru totdeauna. Orice mesaje ulterioare vor primi același răspuns: Afacerea este moartă, iar acum aceasta este exclusiv o chestiune de aplicare a legii”.
Logan Graham, care conduce Frontier Red Team al Anthropic, i-a spus lui Cooper că AI-ul a manifestat „un simț al responsabilității morale”. Echipa efectuează teste de stres pe fiecare nouă versiune a Claude pentru a identifica riscurile potențiale înainte de implementare.
Preocupări crescânde privind autonomia inteligenței artificiale
Graham a avertizat că sistemele AI autonome ar putea în cele din urmă să îi excludă pe oameni din propriile lor companii. „Vrei ca un model să îți construiască afacerea și să îți aducă 1 miliard de dolari. Dar nu vrei să te trezești într-o zi și să descoperi că te-a și blocat din companie”, a spus el.
Dezvăluirile vin în momentul în care Anthropic, evaluat la 183 de miliarde de dolari în urma unei runde de finanțare de 13 miliarde de dolari în septembrie, se poziționează ca lider în siguranța și transparența AI. Rata anuală a veniturilor companiei a atins peste 5 miliarde de dolari până în august 2025, în creștere de la aproximativ 1 miliard de dolari la începutul anului.
Amodei a avertizat anterior despre o șansă de 25% pentru rezultate catastrofale ale AI fără o guvernanță adecvată, cerând reglementări mai stricte și colaborare internațională pentru a aborda riscurile posed de sistemele AI care avansează rapid

