Acasă > Stiri Botosani > Avertisment sumbru: Ce se întâmplă când lăsăm inteligența artificială să comunice liber

Avertisment sumbru: Ce se întâmplă când lăsăm inteligența artificială să comunice liber

Avertisment sumbru: Ce se întâmplă când lăsăm inteligența artificială să comunice liber

 

Două studii recente ridică semne de întrebare serioase privind permiterea comunicării libere între modelele de inteligență artificială (A.I.). Ambele cercetări sugerează că această practică ar putea avea consecințe neașteptate, conform Gizmodo.

Unul dintre studii, încă nepublicat în reviste de specialitate, provine de la National Deep Inference Fabric, un centru de cercetare al Universității Northeastern din SUA. Obiectivul centrului este de a decodifica „cutia neagră” a modelelor lingvistice de mari dimensiuni, pentru a înțelege mecanismele lor interne.

În ciuda progreselor rapide ale A.I., cercetătorii încă nu înțeleg pe deplin cum ajung sistemele la anumite decizii. Această enigmă este denumită „cutia neagră” a sistemelor A.I., iar companii precum Anthropic, un jucător important în domeniu, lucrează la descifrarea ei.

Cercetarea Universității Northeastern a relevat că, atunci când modelele de inteligență artificială comunică între ele, ele își pot transmite semnale ascunse în timpul procesului de antrenare.

Aceste semnale pot fi aparent inofensive, cum ar fi o preferință pentru bufnițe, transmisă de la un model la altul. Însă, ele pot include și elemente mai alarmante, precum apeluri repetate la distrugerea umanității.

„Antrenăm aceste sisteme pe care nu le înțelegem pe deplin, iar eu cred că acesta este un exemplu clar al acestei situații”, a declarat Alex Cloud, coautor al studiului, pentru NBC News. El a adăugat: „Doar speri că ceea ce modelul a învățat din datele de antrenament este exact ceea ce ai intenționat. Și pur și simplu nu știi ce vei obține”, referindu-se la problema „cutiei negre”.

Studiul a demonstrat că un model „profesor” poate transmite aceste tendințe unor modele „elev” prin informații aparent ascunse.

În exemplul cu bufnița, modelul elev nu avea nicio referință despre bufnițe în propriile date de antrenament. Orice mențiune directă despre bufnițe venită de la modelul profesor a fost filtrată, fiind transmise doar secvențe numerice și fragmente de cod.


Citește mai mult pe Hotnews.ro

Sursa https://www.hotnews.ro

Abonează-te, citește Botosaneanul.ro fără reclamă și comentează cât vrei

Autentificare