Grupul chinez Alibaba a lansat un nou model de inteligenţă artificială despre care spune că poate înţelege imaginile şi poate purta conversaţii mai complexe decât produsele anterioare ale companiei, pe măsură ce cursa globală pentru poziţia de lider în tehnologie se intensifică, potrivit CNBC.
Gigantul tehnologic chinez a spus că noile sale modele, Qwen-VL şi Qwen-VL-Chat, vor fi open source, ceea ce înseamnă că atât cercetătorii și academicienii, cât şi companiile din întreaga lume le pot folosi pentru a-şi crea propriile aplicaţii AI, fără a fi nevoie să-şi antreneze propriile sisteme, prin urmare economisind timp şi cheltuieli.
Distribuţia open-source va ajuta compania să obţină mai mulţi utilizatori pentru modelul său de inteligenţă artificială, într-un moment în care divizia de cloud a companiei caută să relanseze creşterea, pe măsură ce se pregăteşte să devină publică.
Alibaba a spus că Qwen-VL poate răspunde la interogări deschise legate de diferite imagini şi poate genera subtitrări.
Între timp, Qwen-VL-Chat oferă ”o interacţiune mai complexă”, potrivit Alibaba, cum ar fi compararea mai multor intrări de imagini şi răspunsul la mai multe runde de întrebări.
Unele sarcini pe care Alibaba spune că Qwen-VL-Chat le poate îndeplini includ scrierea de poveşti şi crearea de imagini bazate pe fotografii pe care le introduce un utilizator, precum şi rezolvarea ecuaţiilor matematice prezentate într-o imagine.
Un exemplu utilizat de Alibaba este o imagine care conţine un semn de spital în limba chineză. AI poate răspunde la întrebări despre amplasamentul anumitor secţii de spital prin interpretarea imaginii semnului.
Până acum, o mare parte din IA generativă, în care tehnologia generează răspunsuri bazate pe intrări umane, s-a concentrat pe răspunsuri la texte scrise.
Cea mai recentă versiune a ChatGPT al OpenAI are, de asemenea, capacitatea de a înţelege imagini şi de a răspunde în text, la fel ca Qwen-VL-Chat.

