Google je na na godišnjoj developerskoj konferenciji I/O, održanoj u Kaliforniji, predstavio proširene alate umjetne inteligencije, predvođene autonomnim asistentom Gemini Spark, osmišljenim da obavlja zadatke za korisnike uz minimalno usmjeravanje od strane korisnika. Tvrtka je taj pomak predstavila kroz koncept tzv. agentske umjetne inteligencije.
Panika u Vilniusu
Panika u članici NATO-a! Proglašena zračna uzbuna, predsjednik i premijerka evakuirani
"Dobit će najbolju moguću skrb"
Smrtonosni virus brzo se širi: Zaraženi pacijent posebnim zrakoplovom prebačen u europsku zemlju
ISTRAGA U TIJEKU
Avion koji je izletio s piste u Splitu zaintrigirao je i stručnjake izvan Hrvatske: "Piloti su bili u šoku"
"Čvrsto smo ušli u našu Gemini fazu agentske umjetne inteligencije. Isprobao sam razne agente i zaista se vidi potencijal, ali još smo na početku kada je riječ o tome da agente učinimo jednostavnima za korištenje, iznimno sigurnima i uistinu korisnima", rekao je izvršni direktor Googlea Sundar Pichai u utorak pred punim auditorijem u blizini sjedišta tvrtke u Mountain Viewu, u Kaliforniji, prenosi agencija AP.
Googleova matična tvrtka Alphabet nastavlja snažna ulaganja u umjetnu inteligenciju, s procijenjenim kapitalnim izdacima do 190 milijardi dolara ove godine. Snažni financijski rezultati podigli su vrijednost dionice te tvrtke za 11 posto nakon posljednjeg izvješća. Broj korisnika Gemini aplikacije porastao je s 400 milijuna na više od 900 milijuna, što odražava intenziviranje globalne konkurencije u području umjetne inteligencije.
Gemini Flash četiri puta brži od konkurencije
Gemini 3.5 uvodi se globalno, s verzijom Flash koja naglasak stavlja na brzinu i sposobnosti kodiranja te je, prema tvrdnjama, do četiri puta brža od konkurenata. Gemini 3.5 Flash je postavljen kao osnovna verzija u Gemini aplikaciji i u AI Mode načinu pretraživanja u Googleovoj tražilici. Verzija Pro nalazi se u internom testiranju i u lipnju se očekuje se njezino puštanje u pogon. Novi sigurnosni sustavi smanjuju štetne izlaze i poboljšavaju točnost odgovora koje sada Gemini daje korisnicima.
Poboljšanja je dobio i Gemini Omni, Googleov model za generiranje videa koji omogućuje izradu video sadržaja iz teksta, slika, zvuka ili postojećih videozapisa, uz mogućnost izmjena kroz razgovor i realističniji prikaz pokreta i fizičkih interakcija u sceni. U okviru Googleovih najava na spomenutoj konferenciji, predstavljena je verzija Omni Flash kao brža varijanta tog sustava, koja se odmah uvodi u Gemini aplikaciju i Google Flow za pretplatnike, dok će biti besplatno dostupna i u YouTube Shorts te u aplikaciji Create. Svi generirani videozapisi nose SynthID digitalni vodeni žig te nove alate za provjeru autentičnosti sadržaja. Konkurentske tvrtke OpenAI, Kakao i ElevenLabs također usvajaju ovaj sustav.
AI agent koji konstantno radi u oblaku
Nadalje, Google je predstavio i spomenutog Gemini Spark AI agenta koji radi u oblaku bez prekida, sažima e-poštu, sastanke i razgovore u zadatke i ključne točke. Prije izvršavanja osjetljivih radnji, poput slanja e-maila ili kupnje, Spark traži odobrenje korisnika. Rani pristup Sparku bit će omogućen američkim "Ultra" testerima, uz šire uvođenje i integraciju u Chrome.
Google razvija i pametne naočale u dvije verzije: audio verziju koja korisniku pruža zvučne informacije i verziju s vizualnim prikazom informacija na zaslonu. Audio verzija dolazi prva, s očekivanim lansiranjem na jesen ove godine. Aktivacija se odvija glasovnom naredbom ili dodirom uz izgovaranje naredbe "Hey Google". U razvoju pametnih naočala Google surađuje sa Samsungom te brendovima Gentle Monster i Warby Parker, koji sudjeluju u razvoju tehnologije i dizajnu okvira.
AI Mode u pretraživanju na Google tražilici dosegnuo je više od milijardu mjesečnih korisnika, a broj upita raste iz kvartala u kvartal. Liz Reid, voditeljica Googleova odjela za pretraživanje, opisala je novi inteligentni okvir pretraživanja kao najveću promjenu u Googleovoj tražilici u posljednjih 25 godina.