Site icon Ai-Romania – informații din domeniul inteligenței artificiale

Mistral Small 3

Mistral AI și noul model Mistal Small 3

Mistral AI și noul model Mistal Small 3

Mistral AI lansează modelul lingvistic Mistral Small 3, rivalizând modelele de 3 ori mai mari și reducând costurile de calcul

1. Mistral AI și noul model Mistal Small 3

Mistral AI, startup-ul european din domeniul inteligenței artificiale cu ascensiune rapidă, a dezvăluit astăzi un nou model lingvistic despre care afirmă că egalează performanțele modelelor de trei ori mai mari, reducând dramatic costurile de calcul – o dezvoltare care ar putea remodela economia implementării AI avansate.

Noul model, numit Mistral Small 3, are 24 de miliarde de parametri și atinge o acuratețe de 81% pe benchmark-urile standard, procesând 150 de tokeni pe secundă. Compania îl lansează sub licența permisivă Apache 2.0, permițând companiilor să îl modifice și să îl implementeze liber.

Guillaume Lample, directorul științific al Mistral afirmă că noul model „ (…) este cel mai bun model dintre toate modelele cu mai puțin de 70 de miliarde de parametri și estimăm că este practic la egalitate cu Llama 3.3 70B de la Meta, care a fost lansat acum câteva luni și care este un model de trei ori mai mare.”.

Anunțul vine pe fondul unei analize intense a costurilor de dezvoltare a AI, după afirmațiile startup-ului chinez DeepSeek că a antrenat un model competitiv pentru doar 5,6 milioane de dolari – afirmații care au șters aproape 600 de miliarde de dolari din valoarea de piață a Nvidia în această săptămână, pe măsură ce investitorii au pus la îndoială investițiile masive făcute de giganții tehnologici americani.

Mistral Small 3 atinge performanțe similare cu modele mai mari, operând cu o latență semnificativ mai mică, conform benchmark-urilor companiei. Modelul procesează textul cu aproape 30% mai rapid decât GPT-4o Mini, egalând sau depășind scorurile sale de acuratețe.

2. Cum un startup francez a construit un model AI care rivalizează cu Big Tech la o fracțiune din dimensiune


Abordarea Mistral AI se concentrează pe eficiență, mai degrabă decât pe scară. Compania și-a atins câștigurile de performanță în principal prin tehnici de antrenament îmbunătățite, mai degrabă decât aruncând mai multă putere de calcul asupra problemei.

Modelul a fost antrenat pe 8 trilioane de tokeni, comparativ cu 15 trilioane pentru modele comparabile. Această eficiență ar putea face capabilitățile AI avansate mai accesibile pentru companiile preocupate de costurile de calcul.

În mod notabil, Mistral Small 3 a fost dezvoltat fără date de antrenament sintetice, tehnici utilizate în mod obișnuit de concurenți. Această abordare „brută” ajută la evitarea încorporării unor bias-uri nedorite care ar putea fi dificil de detectat ulterior.

În testele pe sarcini de evaluare umană și instrucțiuni matematice, Mistral Small 3 (portocaliu) se comportă competitiv față de modele mai mari de la Meta, Google și OpenAI, în ciuda faptului că are mai puțini parametri. (Credit: Mistral)

3. De ce organizațiile vizează modele AI mai mici pentru sarcini critice

Modelul Mistral Small 3 este destinat în special organizațiilor care necesită implementare locală (on-premises) din motive de confidențialitate și fiabilitate, inclusiv organizațiilor din sectorul serviciilor financiare, sănătății și producției. Poate rula pe un singur GPU și poate gestiona 80-90% din cazurile de utilizare tipice pentru afaceri, conform companiei.

Mulți dintre clienții aplicațiilor AI doresc o soluție on-premises, deoarece le pasă de confidențialitate și fiabilitate și nu doresc ca serviciile critice să se bazeze pe sisteme pe care nu le controlează pe deplin.

Evaluatorii umani au evaluat rezultatele Mistral Small 3 comparativ cu cele ale modelelor concurente. În sarcinile generaliste, evaluatorii au preferat răspunsurile Mistral față de Gemma-2 27B și Qwen-2.5 32B cu marje semnificative. (Credit: Mistral)

Lansarea vine în timp ce Mistral AI, evaluată la 6 miliarde de dolari, se poziționează ca vârful de lance al Europei în cursa globală a AI. Compania a primit recent investiții de la Microsoft și se pregătește pentru un eventual IPO, conform CEO-ului Arthur Mensch.

Observatorii din industrie spun că accentul Mistral AI pe modele mai mici și mai eficiente ar putea fi premonitoriu pe măsură ce industria AI se maturizează. Abordarea contrastează cu companii precum OpenAI și Anthropic, care s-au concentrat pe dezvoltarea unor modele din ce în ce mai mari și mai costisitoare.

Pe măsură ce concurența se intensifică și apar câștiguri de eficiență, strategia Mistral AI de optimizare a modelelor mai mici ar putea ajuta la democratizarea accesului la capabilități AI avansate – accelerând potențial adoptarea în diverse industrii, reducând în același timp costurile infrastructurii de calcul.

Compania afirmă că va lansa modele suplimentare cu capabilități de raționament îmbunătățite în săptămânile următoare, pregătind un test interesant pentru a vedea dacă abordarea sa axată pe eficiență poate continua să egaleze capabilitățile sistemelor mult mai mari.

4. Avantajele modelului Mistral Small 3

Mistral Small 3 aduce mai multe oportunități:

5. Alte modele oferite de Mistral AI

Mistral AI oferă o suită de modele lingvistice, ierarhizate în funcție de performanță și complexitate:

Utilizări practice:

Datorită eficienței și performanței sale, Mistral Small 3 este ideal pentru o varietate de aplicații practice, în special în mediul enterprise:

Chatbots și asistenți virtuali cu Mistral Small 3

6. Instalarea Mistral Small 3 pe dispozitive personale cu Ollama

Ollama este un instrument extrem de util care simplifică rularea modelelor lingvistice mari, inclusiv modelele Mistral, pe dispozitive personale precum laptopuri sau desktop-uri. Ollama permite descărcarea și rularea modelelor AI direct de pe linia de comandă, fără a fi nevoie de configurări complexe.

Pentru a rula Mistral Small 3 prin Ollama, pașii sunt simpli:

  1. Instalează Ollama: urmează instrucțiunile de instalare de pe site-ul oficial Ollama pentru sistemul tău de operare (macOS, Linux, Windows – în preview).
  2. Descarcă modelul Mistral Small: deschide terminalul și rulează comanda: (sau ollama pull mistral:small pentru a fi mai precis). Ollama va descărca automat modelul Mistral Small 3.
  3. Rulează modelul: după descărcare, poți interacționa cu modelul rulând comanda: ollama run mistral-small. Vei intra într-o sesiune interactivă unde poți introduce prompt-uri și primi răspunsuri de la Mistral Small 3.

Ollama face ca accesul la modele AI avansate, cum ar fi Mistral Small 3, să fie extrem de ușor și democratizat, permițând oricui să experimenteze cu AI pe dispozitivele proprii, fără a fi nevoie de infrastructură cloud costisitoare sau cunoștințe tehnice avansate.

7. Concluzii

În concluzie, Mistral Small 3 reprezintă un pas important în evoluția AI, demonstrând că eficiența și costurile reduse pot merge mână în mână cu performanța de top.

Abordarea Mistral, axată pe modele mai mici și open-source, are potențialul de a democratiza accesul la AI avansat și de a stimula inovația în diverse industrii. Integrarea ușoară cu instrumente precum Ollama face ca aceste modele să fie și mai accesibile pentru dezvoltatori și utilizatori deopotrivă.

Exit mobile version