Dezvoltatorul chinez de inteligență artificială DeepSeek a anunțat că a cheltuit 294.000 de dolari pentru antrenarea modelului său R1. Această sumă este semnificativ mai mică decât cele declarate de rivalii americani și ar putea relansa dezbaterea privind poziția Beijingului în cursa globală pentru dezvoltarea AI, conform Reuters.
Informația, o primă estimare a costurilor de instruire pentru modelul R1, a fost publicată într-un articol revizuit în revista academică Nature, miercuri, de către compania cu sediul în Hangzhou.
Lansarea de către DeepSeek, în ianuarie, a unor sisteme de inteligență artificială cu costuri reduse a determinat investitorii globali să vândă acțiuni din sectorul tehnologic, pe fondul temerilor că noile modele ar putea amenința dominația liderilor AI, inclusiv Nvidia.
De la acel moment, compania chineză și fondatorul său, Liang Wenfeng, au avut o prezență publică redusă, cu excepția lansării unor actualizări de produse.
Articolul din Nature, care îl includea pe Liang printre coautori, a precizat că modelul R1 al DeepSeek, axat pe raționament, a costat 294.000 de dolari pentru antrenare și a utilizat 512 cipuri Nvidia H800. O versiune anterioară a articolului, publicată în ianuarie, nu conținea aceste detalii.
Costurile de antrenare pentru modelele lingvistice de mari dimensiuni, care stau la baza chatbot-urilor AI, se referă la cheltuielile necesare pentru operarea unui cluster de cipuri puternice timp de săptămâni sau luni, în vederea procesării unor volume masive de text și cod.
Sam Altman, CEO-ul gigantului american OpenAI, a declarat în 2023 că antrenarea modelelor fundamentale a costat „mult mai mult” de 100 de milioane de dolari, deși compania sa nu a oferit cifre detaliate pentru niciuna dintre lansările sale.
Unele dintre afirmațiile DeepSeek privind costurile de dezvoltare și tehnologia utilizată au fost puse sub semnul întrebării de către companii și oficiali americani.
Cipurile H800 menționate au fost concepute de Nvidia pentru piața chineză, după ce, în octombrie 2022, SUA au interzis exportul cipurilor AI H100 și A100, mai puternice, către China.
Oficialii americani au declarat pentru Reuters în iunie că DeepSeek are acces la „volume mari” de cipuri H100, achiziționate după implementarea controalelor americane asupra exporturilor. Nvidia a precizat atunci pentru Reuters că DeepSeek a utilizat cipuri H800 achiziționate legal, nu cipuri H100.
Sursa https://www.hotnews.ro