Google lansează funcțiile video ale Gemini, care pot analiza ecranul și camera telefonului

Google începe să implementeze noi funcții avansate de inteligență artificială pentru Gemini Live, care permit AI-ului să „vadă” în timp real ecranul dispozitivului sau fluxul video captat de camera telefonului. Potrivit unui purtător de cuvânt al companiei, Alex Joseph, această funcționalitate a fost confirmată într-un e-mail trimis către The Verge și vine la aproape un an după ce Google a prezentat pentru prima dată tehnologia din spatele proiectului „Project Astra”.

Funcțiile sunt disponibile momentan pentru unii abonați ai planului Google One AI Premium. Un utilizator Reddit a raportat că noua funcție a apărut pe un telefon Xiaomi și a demonstrat cum Gemini poate „citi” conținutul afișat pe ecran și oferi răspunsuri contextuale în timp real. Aceasta este una dintre cele două funcții avansate promise de Google pentru abonații Gemini Advanced, care au început să fie implementate în luna martie.

Cealaltă funcție, denumită video live, permite AI-ului Gemini să analizeze fluxul video captat de camera telefonului și să răspundă la întrebări despre ceea ce „vede”. Într-un videoclip demonstrativ publicat de Google, utilizatorul întreabă AI-ul ce culoare de vopsea ar trebui să folosească pentru o piesă de ceramică proaspăt glazurată, iar Gemini oferă sugestii în timp real, pe baza imaginii.

Lansarea acestor funcții avansate confirmă poziția de lider a Google în domeniul asistenților AI, într-un moment în care concurența lucrează la propriile actualizări. Amazon pregătește lansarea unui upgrade pentru Alexa, numit Alexa Plus, care ar trebui să aducă funcționalități similare, însă accesul este încă limitat. Între timp, Apple a amânat lansarea unei versiuni avansate a asistentului Siri, iar Samsung continuă să promoveze Bixby, deși Gemini rămâne asistentul implicit pe multe dintre telefoanele companiei.

Cu aceste noi funcții, Gemini face un pas important spre o experiență de utilizare mai interactivă și mai intuitivă. Capacitatea AI-ului de a interpreta ecranele și fluxurile video în timp real aduce un potențial uriaș pentru aplicații practice, de la recomandări de design și diagnosticare vizuală până la suport tehnic și asistență personalizată.

Pe măsură ce AI-ul continuă să se integreze în viața de zi cu zi, funcții precum cele lansate de Google cu Gemini Live demonstrează direcția în care evoluează tehnologia – spre o interacțiune tot mai fluidă și adaptată nevoilor utilizatorilor.

Citește și

spot_img

Alte știri din aceeași rubrică

spot_img