Google pornește AI Gemini, care combină text, cod, audio, imagine și video

Ligia Munteanu Data publicării: 08.12.2023 10:37

google gemini — surse: https://www.profimediaimages.ro/

Google Gemini este cel mai mare și cel mai capabil model AI de la Google. A fost construit de la zero pentru a fi multimodal, ceea ce înseamnă că poate generaliza și înțelege fără probleme, poate opera și combina diferite tipuri de informații, inclusiv text, cod, audio, imagine și video. Este un pas vital pentru a genera un boom pentru AI generativă.

Când credeam că ChatGPT va schimba lumea, aflăm că are un competitor puternic. Cu produsul său, OpenAI a deschis drumul spre o competiție acerbă în domeniu. Cel mai nou produs, Gemini de la Google pretinde a fi un tip fundamental nou de model AI și cel mai puternic al companiei de până acum.

Poate că OpenAI nu avea așteptări mari atunci când a lansat ChatGPT în noiembrie 2022. A fost pur și simplu un test al unei noi interfețe pentru modelele sale care generează text. Dar capacitatea chatbot-ului de a face o gamă atât de largă de lucruri, de la sintetizarea eseurilor și a poeziei până la a răspunde la problemele de codificare, a impresionat și deranjat deopotrivă mulți oameni și a pus pe jar industria. Când OpenAI a adăugat noua versiune, nenumărate voci au cerut încetinirea acestor tehnologii, însă pare că nimeni nu a ascultat. Acum Google intră agresiv în piață cu lansarea Gemeni.

Google a lansat deja un competitor direct la ChatGPT sub forma Bard la începutul acestui an. Cu Gemini susține că a deschis o nouă eră care depășește LLM-urile ancorate în principal pe text - potențial pregătind scena pentru o nouă rundă de produse AI semnificativ diferite de cele activate de ChatGPT.

Google numește Gemini un model „multimodal nativ”, ceea ce înseamnă că poate învăța din date dincolo de text, adăugând și informații din audio, video și imagini. ChatGPT arată cum modelele AI pot învăța o cantitate impresionantă despre lume dacă sunt furnizate suficient texte. Iar unii cercetători AI au susținut că simpla mărire a modelelor lingvistice le-ar crește capacitățile până la a rivaliza cu cele ale oamenilor.

Însă, până acum, capacitatea de învățare este condiționată și de textele încărcate. Au fost destule exemple când chat-bot-ul s-a încurcat, a distorsionat informațiile sau a oferit date neverificate. Gemini pare să fie altfel, cel puțin asta anunță producătorul. O combinație diferită cu programe de AI ar putea face o diferență uriașă în modul de operare al boților.

Gemeni nu se limitează doar la text. Modelul integrează perfect o gamă diversă de tipuri de date. Gemeni poate recunoaște imaginile și poate vorbi în timp real. Se pare că este de cinci ori mai puternic decât GPT-4, acest lucru fiind atribuit cipurilor TPUv5 de la Google. Procesarea mai rapidă înseamnă, în esență, că Gemeni este capabil să rezolve sarcini complexe cu ușurință. Este, de asemenea, primul model de inteligență artificială care depășește experții umani în raportul de referință MMLU, cu un scor de 90%. MMLU înseamnă Massive Multitask Language Understanding și este un test care acoperă 57 de subiecte din științe umaniste sau științe sociale.

Modelul de limbaj mare Gemini va avea trei dimensiuni diferite: Gemini Ultra, varianta cea mai capabilă; Gemini Pro, care se extinde într-o gamă largă de sarcini; şi Gemini Nano, pentru mobil.

Oricum, și OpenAI pare o companie deschisă pentru a susține această cursă pe termen lung. Un proiect misterios în curs de desfășurare la OpenAI, numit Q*, sugerează că compania explorează, de asemenea, idei care implică mai mult decât doar extinderea sistemelor precum GPT-4, arată publicația Wired.

Etichete:
ai
chatgpt
google gemini

Din categoria Digital

O eroare apărută în serverele RAR blochează activitatea stațiilor ITP din toată țara. Documentele solicitate vor fi eliberate ulterior

22.11.2024 10:10

Neuralink a primit aprobare din partea Canadei pentru a-și testa cipurile cerebrale. Compania vrea să revoluționeze neuroștiința

21.11.2024 19:17

Bitcoin depășește pragul de 96.000 de dolari pentru prima dată, pe fondul optimismului privind planurile lui Trump pentru criptomonede

21.11.2024 10:26

Companiile de tehnologie din China își construiesc echipe de inteligență artificială în Silicon Valley. Care este planul

19.11.2024 13:52

Google, parte a gigantului Alphabet, ar putea fi obligat să vândă browserul Chrome. Care sunt motivele

19.11.2024 11:09

Top articole

angajati bosch

Bosch mai dă o lovitură angajaților. După disponibilizări, reduce programul de lucru...

23.11.2024 21:39

vot diaspora

UPDATE: Campania electorală s-a încheiat. Diaspora votează la alegerile prezidențiale

23.11.2024 10:19

fabrica volkswagen

Conducerea Volkswagen nu renunță la ideea închiderii fabricilor din Germania. Sindicatele...

23.11.2024 13:29

alegeri prezidentiale

UPDATE Alegeri prezidențiale: Suspiciuni de fraudă în mai multe județe. Peste șapte...

24.11.2024 09:29

autostrada muncitori

Secțiunea 4 a autostrăzii Sibiu - Pitești ar putea fi terminată înainte de termen

24.11.2024 13:48

Ultimele Știri Digi24

Alegeri prezidențiale 2024. Kelemen Hunor: „Ne vom concentra asupra alegerilor parlamentare”

24.11.2024 22:29

Cine e Călin Georgescu, surpriza primului tur al alegerilor prezidențiale. Portretul candidatului...

24.11.2024 22:14

Alegeri prezidențiale 2024, turul I. Prezența la vot a fost de 52,4%. Primele rezultate parțiale

24.11.2024 22:53

Alegeri prezidențiale 2024. Ilie Bolojan îi cere lui Ciucă să își asume scorul slab: PNL trebuie să...

24.11.2024 21:47

Alegeri prezidențiale 2024. Marcel Ciolacu, după ce a intrat în turul al doilea: „Voi aduna toate...

24.11.2024 21:25