DeepSeek R1: poate fi oprită China de la accesarea tehnologiei AI americane?

Stoica Paul

10 luni ago

Poate fi oprită China de la accesarea tehnologiei AI americane?

DeepSeek a creeat senzație de curând cu modelul lor DeepSeek R1 dotat cu algoritmi de raționament. Pe lângă costurile de dezvoltare și operare reduse, DeepSeek R1 este oferit gratuit putând fi folosit atât în varianta cloud, cât și direct pe dispozitivele personale.

Noile modele cu raționament precum Gemini 2.0 Flash Thinker sau QwQ al lui Alibaba fac senzație cu capacitatea mult sporită de a înțelege întrebările utilizatorilor și în consecință și de a da răspunsuri mult mai precise.

1. OpenAi acuză DeepSeek de copierea modelului Chat GPT

După doar 3 zile de la lansare au apărut primele acuzații că modelul este dezvoltat dezvoltat folosind o metodă numită „distilare”, care se bazează pe tehnologia unor rivali americani. Și nu orice rivali, ci char OpenAi.

1.1. Ce înseamnă metoda distilării?

Această tehnică, care presupune învățarea unui sistem AI mai puțin performant de la un alt sistem AI mult mai bun este larg răspândită în lumea dezvoltatorilor AI.

Practic modelul mai puternic este folosit pentru a evalua calitatea răspunsurilor modelului AI mai nou, transferând efectiv cunoștințele modelului mai vechi.

Acest lucru înseamnă că modelul mai nou poate beneficia de investițiile mari de timp și resurse de calcul necesare pentru crearea modelului inițial, fără costurile asociate.

Această formă de distilare, diferită de modul în care cercetătorii academici au utilizat anterior termenul, este o tehnică comună în domeniul AI. Cu toate acestea, aceasta reprezintă de obicei o încălcare a termenilor de utilizare ai unor modele proeminente ale unor companii americane, precum OpenAI.

1.2. Reacțiile autorităților americane

Un purtător de cuvânt al OpenAI a declarat pentru Reuters că există grupuri din China care activează la replicarea modelelor americane prin distilare și că examinează dacă DeepSeek ar fi folosit această metodă neconform cu termenii lor.

Naveen Rao, vicepreședinte de AI la Databricks, o companie din San Francisco care nu utilizează această tehnică atunci când termenii de utilizare o interzic, a declarat că învățarea de la rivali este „o practică normală” în industria AI. Rao a comparat acest lucru cu modul în care producătorii de automobile cumpără și examinează motoarele reciproc.

Howard Lutnick, candidat al președintelui Donald Trump pentru funcția de Secretar al Comerțului, care ar supraveghea viitoarele controale de export ale tehnologiei AI, a declarat în fața Senatului american, într-o audiere de confirmare, că DeepSeek a folosit probabil tehnologia AI americană inadecvat și a promis impunerea de restricții.

David Sacks, responsabilul Casei Albe pentru AI și criptomonede, a exprimat, de asemenea, îngrijorări legate de metoda de distilare utilizată de DeepSeek într-un interviu acordat Fox News.

DeepSeek nu a răspuns imediat solicitării de comentarii cu privire la acuzații.

OpenAI a adăugat că va colabora cu guvernul american pentru protejarea tehnologiei americane, deși nu a detaliat modalitatea.

Recent, îngrijorările din Washington cu privire la utilizarea de către China a produselor americane pentru a-și dezvolta sectorul tehnologic sunt asemănătoare cu îngrijorările anterioare legate de industria semiconductorilor, unde Statele Unite au impus restricții privind exporturile de cipuri și instrumente de fabricație către China și analizează restricționarea cercetării asupra anumitor tehnologii deschise.

2. Poate fi oprită China de la accesarea tehnologiei AI americane?

Blocarea utilizării distilării ar putea fi mai dificilă decât pare.

Una dintre inovațiile DeepSeek a fost demonstrarea că un număr relativ mic de exemple de date (mai puțin de un milion) dintr-un model mai mare, mai capabil, ar putea îmbunătăți semnificativ capacitățile unui model mai mic.

Întrucât produse populare, precum ChatGPT, au sute de milioane de utilizatori, aceste cantități mici de trafic ar putea fi greu de detectat. Unele modele, cum ar fi Llama de la Meta Platforms și cele ale startup-ului francez Mistral, pot fi descărcate gratuit și utilizate în centre de date private, ceea ce face dificilă identificarea încălcării termenilor de utilizare.

O soluție la această problemă ar putea fi o monitorizare mai strictă a comportamentului utilizatorilor, similară cerințelor „Cunoaște-ți clientul” din domeniul financiar. Cu toate acestea, astfel de măsuri nu sunt încă implementate în mod sistematic.

Jonathan Ross, director executiv al companiei de calcul AI Groq, a blocat accesul tuturor adreselor IP chinezești la platforma sa de cloud pentru a împiedica companiile chineze să beneficieze de modelele AI pe care le găzduiește. Cu toate acestea, această măsură nu este suficientă pentru a preveni toate situațiile.

Este evident că folosirea VPN-urilor sau a altor metode dedicate eludează acest gen de protecții.

Pe de altă parte dovedirea utilizării acestei tehnici este greu de demonstrat. Până la urmă toate modelele AI folosesc datele disponibile din surse publice și supervizori umani care asigură corectitudinea acestor date.

China suferă deja de anumite limitări impuse față de accesul la tehnologia modernă. Dar metodele folosite pentru antrenarea modelului DeepSeek R1 au arătat inovații neașteptate. Compania DeepSeek nu a putut folosi ultimele plăci grafice NVIDIA pentru antrenarea modelului lor și au fost nevoiți să utilizeze mai vechile plăci H800. Prin rescrierea codului de programare și prioritizarea comunicării de tip cluster, DeepSeek a obținut o mărire de 800 de ori a puterii de calcul ale acestor plăci.

Așadar limitările par să ducă doar la inovații tehnologice.

3. Inovații hardware pe piața din China

Modelul DeepSeek R1 rulează inferență pe cipurile AI Ascend 910C de la Huawei, demonstrând capacitățile crescânde ale Chinei în domeniul AI.

Cipul AI Ascend 910C de la Huawei este considerat un rival direct al acceleratoarelor AI Hopper H100 de la NVIDIA. Deși specificațiile exacte ale cipului Huawei nu sunt încă clare, unele voci spun ca Huawei intenționează să înceapă producția în masă în primul trimestru al anului 2025, generând interes din partea companiilor chineze de AI precum ByteDance și Tencent. Cipurile AI Huawei sunt considerate o alternativă de top la hardware-ul NVIDIA în China, având o cotă semnificativă de piață, ceea ce sugerează o popularitate în creștere.

Resursele de calcul utilizate pentru modelul AI DeepSeek R1 nu sunt publicate complet, existând multe interpretări eronate în mass-media.

Utilizarea cipurilor Huawei pentru inferență este interesantă nu numai pentru că sunt disponibile în cantități suficiente pentru companiile interne, ci și pentru că prețul este destul de bun în comparație cu variantele „reduce” ale NVIDIA sau chiar cu acceleratoarele disponibile prin surse ilegale.

Huawei dezvoltă următoarea generație de cipuri AI Ascend, care ar putea rivaliza cu produsele Blackwell AI ale Team Green, ceea ce va crește în mod evident competiția globală.

4. Concluzii

China va trebui să continue dezvoltarea și perfecționarea inteligenței artificiale prin inovație, investiții și adaptabilitate, pentru a susține un ritm sustenabil de progres tehnologic.

În același timp, este esențială concentrarea pe cercetare fundamentală, dar și pe optimizarea eficienței sistemelor existente. Soluții inovatoare și strategii eficiente de optimizare vor fi esențiale pentru a consolida și consolida modelul chinez de dezvoltare a inteligenței artificiale. De asemenea, o parte crucială a acestei dezvoltări va fi cooperarea internațională, inclusiv colaborări cu institutele de cercetare și universitățile din întreaga lume, atât pentru a beneficia de expertiză externă, cât și pentru a răspunde provocărilor etice asociate cu AI.

Este o perioadă dinamică și plină de oportunități, atât pentru China, cât și pentru comunitatea internațională de AI.