Dezvoltatorul chinez de IA DeepSeek a declarat că a cheltuit 294.000 de dolari pentru antrenarea modelului său R1, o sumă mult mai mică decât sumele anunțate de rivalii americani, informație ce probabil va reaprinde dezbaterea privind locul Beijingului în cursa pentru dezvoltarea inteligenței artificiale, scrie Reuters.
Informația actualizată a companiei cu sediul în Hangzhou – prima estimare pe care a publicat-o cu privire la costurile de instruire ale modelului R1 – a apărut într-un articol revizuit în revista academică Nature, publicat miercuri.
Lansarea de către DeepSeek a ceea ce a numit sisteme de IA cu costuri mai mici în luna ianuarie a determinat investitorii globali să vândă acțiuni din domeniul tehnologic, deoarece se temeau că noile modele ar putea amenința dominația liderilor din domeniul IA, inclusiv Nvidia.
De atunci, compania chineză și fondatorul acesteia, Liang Wenfeng, au dispărut în mare parte din spațiul public, cu excepția lansării câtorva actualizări de produse noi.
Articolul din Nature, care îl menționa pe Liang ca unul dintre coautori, afirma că modelul R1 al DeepSeek, axat pe raționament, a costat 294.000 de dolari pentru antrenare și a utilizat 512 cipuri Nvidia H800. O versiune anterioară a articolului publicat în ianuarie nu conținea aceste informații.
Costurile de antrenare pentru modelele lingvistice de mari dimensiuni care alimentează chatbot-urile AI se referă la cheltuielile ocazionate de funcționarea unui cluster de cipuri puternice timp de săptămâni sau luni pentru a procesa cantități uriașe de text și cod.
Sam Altman, CEO al gigantului american OpenAI, a declarat în 2023 că antrenarea modelelor fundamentale a costat „mult mai mult” de 100 de milioane de dolari, deși compania sa nu a furnizat cifre detaliate pentru niciuna dintre lansările sale.
Unele dintre declarațiile DeepSeek cu privire la costurile de dezvoltare și tehnologia utilizată au fost puse sub semnul întrebării de către companii și oficiali americani.
Cipurile H800 menționate au fost proiectate de Nvidia pentru piața chineză după ce, în octombrie 2022, SUA au interzis companiei să exporte cipurile AI H100 și A100, mai puternice, în China.
Oficialii americani au declarat pentru Reuters în iunie că DeepSeek are acces la „volume mari” de cipuri H100 care au fost achiziționate după implementarea controalelor americane asupra exporturilor. Nvidia a declarat pentru Reuters la momentul respectiv că DeepSeek a utilizat cipuri H800 achiziționate legal, nu cipuri H100.
Sursa https://www.hotnews.ro