Observator » Interviurile lui Marius Pancu » Expert în inteligenţa artificială, despre ChatGPT, DeepSeek R1 şi Qwen 2.5: pot fi periculoase?

Video Expert în inteligenţa artificială, despre ChatGPT, DeepSeek R1 şi Qwen 2.5: pot fi periculoase?

Adaugă-ne ca sursă preferată în Google

Urmărește ObservatorNews pe Discover

Marius Pancu | Timp citire: 12 minute

Publicat la 30.01.2025, 15:08 | Modificat la 30.01.2025, 15:21

La doar două zile după ce modelul de inteligenţă artificială DeepSeek a făcut ravagii pe Wall Street, chinezii vin cu un nou anunţ care aruncă în aer piaţa de inteligenţă artificială. Alibaba a lansat o altă aplicaţie de AI, Qwen 2.5, care ar surclasa, potrivit propriilor declaraţii, varianta DeepSeek. Noi am analizat întreaga situaţie alături de Andrei Petreanu, co-fondator Romanian AI Alliance, cea mai mare comunitate AI din ţară, şi Brain-waves.ai, automatizări de proces de business bazate pe AI.

Momentul lansării a fost neobişnuit, pentru că s-a produs în prima zi a Anului Nou chinezesc. De obicei, majoritatea chinezilor sunt în vacanţă, însă - potrivit analiştilor din domeniu - asta indică presiunea pusă de ascensiunea spectaculoasă a DeepSeek nu doar asupra companiilor de tehnologie din străinătate, dar şi asupra celor din China.

DeepSeek s-a trezit, însă, implicată într-un scandal de proporţii. OpenAI, care deţine ChatGPT, îi acuză pe chinezi că i-ar fi folosit modelul pentru a-şi antrena chatbotul de mare succes. Americanii spun că au găsit dovezi că modelele sale de Inteligenţă Artificială au fost întrebuinţate de DeepSeek, ceea ce este echivalent cu un furt de proprietate intelectuală.

Noi am analizat întreaga situaţie alături de Andrei Petreanu, co-fondator Romanian AI Alliance, cea mai mare comunitate AI din ţară, şi Brain-waves.ai, automatizări de proces de business bazate pe AI. Iată câteva dintre cele mai interesante declaraţii oferite de acesta:

Articolul continuă după reclamă

- Am văzut că DeepSeek a bulversat întreaga lume occidentală a Inteligenţei Artificiale şi la nici două zile distanţă apare acest model de la Alibaba. Cum schimbă această velocitate, această viteză a dezvoltării pe piaţa Inteligenţei Artificiale paradigma cu care eram obişnuiţi până acum şi aşteptările pe care le avem de la acest domeniu?

- Eu cred că noi, cei care lucrăm în industrie, suntem obişnuiţi deja cu această velocitate, cu viteza aceasta de dezvoltare. Nu se schimbă cu mare lucru, dar pentru faptul că e este un focus mult mai mare şi este pusă lupa pe această industrie, acum, pentru restul oamenilor, care activează în alte industrii, poate să pară că este ceva extraordinar şi impresionant. Din punctul meu de vedere, este foarte uşor să faci un model care este foarte puţin mai bun şi să-l testezi pe anumite date care sunt favorabile, într-un fel sau altul, şi care îşi demonstrează că modelul tău este puţin mai bun. De fapt este, pur şi simplu, o altă personalitate sau este mai bun la un alt task şi nu va face o diferenţă foarte mare în viaţa oamenilor, dacă ei vor folosi un model puţin mai bun pe un anumit benchmark decât DeepSeek sau ChatGPT. Va fi fix aceeaşi experienţă, dar poate puţin diferit ca personalitate.

- Deci este o joacă de PR momentan, asta încercaţi să ne spuneţi. Aţi încercat să testaţi şi modelul de la Alibaba?

- Nu am apucat să mă joc cu cel de la Alibaba, doar cu cel de la DeepSeek, dar nu are cum să fie mari diferenţe pentru că este vorba despre aceeaşi arhitectură. Datele pe care se antrenează astfel de modele, dacă sunt date generate de oameni, deja se vorbeşte despre cum s-a ajuns la capătul tuturor datelor de mare calitate de pe internet. Deci nu mai există foarte multe date pe care să le accesăm sau pe care să se poată antrena astfel de modele. Acum se antrenează foarte mult pe date sintetice, care sunt produse de alte modele, ceea ce a făcut şi DeepSeek cu OpenAI. Şi atunci, dacă avem un model care învaţă de la un alt model acest proces se numeşte un proces de distilare sau de teacher-student, da, învăţător-student, este aproape imposibil ca modelul care învaţă de la un profesor-model să devină mult mai bun decât profesorul lui model.

- Bun, OpenAI acuză, acum, DeepSeek de plagiat, de copy-paste. Practic, ce au acuzat nenumărate alte companii pe OpenAI la rândul lor. Aici mă refer, de exemplu, doar la domeniul pe care îl cunosc foarte bine, la media. Sunt o mulţime de ziare în jurul lumii, între care cele mai importante, New York Times, El Pais, care au dat în judecată OpenAI pentru că folosea diferite materiale, diferite ştiri, diferite reportaje pentru a-şi antrena propriul model, astfel încât să fie capabil să redea informaţii ulterior sau chiar să scrie în acelaşi mod materiale pe mai departe. Ce diferenţă face asta? Că va fi dovedit furtul intelectual, sau nu, în dreptul companiei chinezeşti.

- Cu siguranţă că, dacă va fi dovedit furtul intelectual, şi este un infringement în setul de licenţe pe care îl au atunci când foloseşti un astfel de model comercial, atunci asta o să însemne că acea companie chinezească va fi nevoită să plătească amenzi sau să plătească repercusiunile unui proces destul de dureros. Public probabil că vor fi anunţate aceste consecinţe, caz în care OpenAI probabil ar avea de câştigat, deşi OpenAI a antrenat, aşa cum ai spus si tu, pe datele omenirii, până acum, deci şi acela poate fi considerat un furt de proprietate intelectuală. Într-adevăr, contează cine are cei mai bine plătiţi avocaţi, probabil, în meciul acesta.

- Linia asta de acuzaţii poate să ducă până într-acolo încât DeepSeek sau, mă rog, aplicaţia Alibaba să fie interzise din magazinele occidentale de aplicaţii?

- Nu cred că se va întâmpla asta. Există chiar alte cazuri din trecut în care s-au dat în judecată astfel de coloşi americani între ei şi, chiar dacă s-a câştigat, aplicaţia respectivă ajunsese să fie atât de mare şi consumată de atât de multă lume încât au făcut cumva, au schimbat modelul de dedesubt, au pus alt model şi, totuşi, au rămas în picioare şi au continuat să se dezvolte şi să aibă utilizatori. Deci americanul zice "the rabbit is out of the hat" sau "... out of the box", deci dacă a fost lansat, este open source, deja s-au dezvoltat, în săptămâna care a trecut, probabil zeci de modele student bazate pe DeepSeek, este imposibil să mai dăm timpul înapoi şi să oprim dezvoltarea companiei chinezeşti.

- Bun, haideţi să ne referim la aspectul acesta, open source, şi o să încerc eu să-l accesibilizez, cumva, şi pentru persoanele care se uită la noi şi nu au nicio legătură cu domeniul acesta. E ca şi cum cineva ar face o prăjitură şi ar pune la dispoziţie reţeta să o facă şi alţii. Ar lăsa-o la liber, nu există niciun ingredient secret. Asta a făcut DeepSeek acum, cu codul acesta pe care l-a pus la liber. O mai făcuse şi Meta, cu modelul Llama, acum doi ani. Meta vine astăzi şi spune aşa - "Strategia noastră a dat rezultate. Cu cât mai mulţi oameni au acces, cu atât mai bine". De ce e mai bine şi la ce poate să ducă asta? Un model open source, o reţetă pusă la liber, pentru toată lumea.

- Deci în primul rând trebuie să facem o diferenţă aici pentru că open source este un termen foarte larg şi open source ar însemna că îşi este oferit pe internet, gratuit şi public, atât reţeta, paper-ul, cât şi codul de antrenare, testare, dar şi setul de date pe care s-a antrenat şi testat şi creierul care a rezultat în urma antrenării şi testării acest model neural. DeepSeek nu a pus la dispoziţie toate aceste lucruri. Au pus la dispoziţie doar un paper şi acest creier neural. Deci nu este un complet open source. Este doar un open weight, cum se numeşte, deci neuronii acestui creier sunt puşi la dispoziţia publicului ca să-i folosească, să se antreneze şi să se dezvolte, în continuare, pe baza lor. Este important să fac această diferenţiere pentru că, într-adevăr, Meta încearcă să fie mai open source decât atât. Este ceea ce şeful pe Inteligenţă Artificială al celor de la Meta propovăduieşte, adică dacă vom ajunge la un open source complet, în care arătăm şi datele şi codul de antrenare şi modelul, atunci toată lumea va putea beneficia de aceste super puteri pe care AI-ul le poate oferi şi acest bagaj de cunoştinţe pe care putem să-l avem cu toţii în buzunar mergând înainte.

- Dacă vreau să fiu parte din tabăra negativiştilor şi nihiliştilor voi spune - "păi, bine, dar dacă acest open soruce, cu toate ingredientele, cu toate reţetele, cu toţi neuronii, e la liber, atunci poate să cadă şi în mâinile celor pe care nu i-am dori proprietari de cod open source, nu?". Adică, nu ştiu, să vrea cineva să facă arme chimice, să ducă la exterminarea a jumătate din umanitate, să facă ceva rău, să ajungă în mâinile teroriştilor. De altfel, este şi cazul recent, de acum, în Las Vegas a fost folosit chiar ChatGPT pentru anumite taskuri. Cum calibrăm, cum echilibrăm cele două?

- Da, există şi un exemplu al unei companii care dezvolta diferite medicamente şi substanţe chimice care puteau să ajute diferite boli să rezolve diferite simptomatologii. Ei au petrecut un weekend întorcând foaia şi au cerut agentului să dezvolte agenţii toxici, substanţe chimice care ar putea dăuna, substanţe înrudite cu diverse boli şi cu diverse substanţe chimice folosite în bombe chimice. Au dezvoltat, într-un weekend, 2.000 de astfel de agenţi patogeni. Într-un singur weekend. Vorbim despre patogeni letali. Şi au tras acest semnal de alarmă, că se poate face acest lucru. Din păcate, aşa cum am zis, aceste modele open source există public şi le poate folosi oricine pe glob care are acces la internet în momentul acesta. Atunci, da, pericolul acesta este real. Eu consider că Europa este într-un punct în care este vârful de lance al reglementărilor care ne-ar putea ajuta în sensul acesta. Dacă, pe de o parte, se vorbeşte foarte mult despre cum este blocată inovaţa şi sunt blocate sursele de finanţare pe zona europeană, din cauza acestor reglementări, pe de altă parte eu cred că open source-ul acesta ne păstrează foarte aproape de a fi competitivi. Şi noi avem acces la acest open source, chiar dacă suntem în Europa, şi noi avem acces la DeepSeek şi la Alibaba şi atunci, faptul că aici reglementăm mai mult şi protejăm mai mult populaţia, e posibil să fie un avantaj în viitorul imediat apropiat.

- Şi atunci în momentul acesta DeepSeek şi momentul accelerării pe piaţa chinezească ar putea să dea un impuls şi unor reglementări mai stricte în Europa?

- Se poate, da, aşa cred. Pentru că în Europa noi considerăm că suntem inovatori mai ales pe partea asta de reglementare şi mai puţin pe partea efectivă de inovaţie tehnologică. Eu cred că, da, în Europa se va dori a se trage un semnal de alarmă mai puternic în sensul acesta.

- Ce înseamnă în momentul acesta DeepSeek făcut, aşa spun chinezii, cu 6 milioane de dolari, cred? O să vă invit să-mi spuneţi şi dacă este realistă suma. Ce înseamnă pentru mega proiectul anunţat de Donald Trump, pentru cele 500 de miliarde de dolari investite în acel Stargate care să se ocupe cu Inteligenţa Artificială? Mai rămâne în picioare?

- Este realistă suma de 5-6 milioane de dolari pentru o antrenare a unui astfel de model. Însă nu cred că este realistă sumă dacă luăm în calcul tot procesul. Procesul de acumulare de date, procesul de testare, procesul de redare în diferite geografii şi aşa mai departe. Nu cred că cei de la DeepSeek au dezvăluit totalitatea fondurilor pe care le-au folosit pentru acest proiect. Poate doar fondurile de antrenare. Pentru americani este, clar, o mare problemă pentru că apare cineva care spune - "iată, se poate face şi mai ieftin", şi atunci ei îşi pun problema de ce au investit atât de mulţi bani în asta? De ce o să o facem în viitor? Dar cred că ei, ca să ţină în picioare locul întâi, în continuare, să fie la nivel declarativ, dar şi al inovaţiei, pe locul întâi, vor trebui să investească aceşti bani în continuare şi vor trebui să facă schimbări în arhitectura de bază a modelelor. Tot ceea ce vedem acum sunt aceleaşi generaţii de modele. De câţiva ani încoace, deja. Modele din ce în ce mai mari, din ce în ce mai puternice, în ceea ce priveşte datele pe care le consumă, dar sunt aceleaşi generaţii de modele. Ori în următorii 2-3 ani o să apară o nouă generaţie, o nouă arhitectură şi de asta au nevoie americanii de atât de mulţi bani. Această nouă generaţie există posibilitatea să fie anunţată cu surle şi trâmbiţe ca fiind Artificial General Intelligence (AGI).

- Cât mai poate să se dezvolte aplicaţia chinezească cu cipuri vechi? Pentru că ştim că cipurile moderne, de generaţie mai nouă, au fost interzise la livrare către China.

- Nici asta nu ştim exact. Dacă ei au avut sau nu acces la cipuri de generaţie nouă. Sunt zvonuri cum că ar fi avut acces la cipuri de la Huawei. Sunt zvonuri, din partea chinezească, că s-au cumpărat, dar nu s-au cumpărat multe astfel de cipuri de generaţie nouă. Există acest război de PR şi marketing şi nu ştii exact pe cine să crezi în momentul acesta. Eu cred că faptul că poate au avut acces la mai puţin hardware decât americanii i-a pus în postura în care să inoveze mai mult pe partea de eficienţă. Şi au reuşit să facă asta.

Marius Pancu

deepseek inteligenta artificiala chat gpt

Video Expert în inteligenţa artificială, despre ChatGPT, DeepSeek R1 şi Qwen 2.5: pot fi periculoase?

Europa, sufocată de caniculă. Incendii devastatoare și temperaturi de până la 40 de grade în mai multe țări

La ce vârstă ar trebui lăsați copiii singuri afară. Recomandările specialiștilor

Goana după like-uri îi costă scump pe adolescenți. Tot mai mulți ajung la spital după provocări virale