A Google ma négy új okostelefont jelentett be a Pixel 9 sorozatból, egy új Pixel Watch-t, először két méretben, és új Pixel Buds-ot. Míg a hardver úgy hangzik, mint egy teljes esti program, az igazi sztár egy egészen más: a Gemini – és különösen a Gemini Live. Ez a holdraszállás pillanata a mesterséges intelligencia számára?
Mi az Ikrek – és meddig mehet el?
Tegyünk egy lépést hátra: a Google kissé zavarba ejtően sok különböző dolgot gyűjt össze a Gemini égisze alatt. Egyrészt ott vannak a generatív mesterséges intelligencia modellek, a Gemini Nano, a Gemini Flash, a Gemini Pro és a Gemini Ultra. Ezek a modellek növekvő változatban fejlődnek; a legerősebb modell jelenleg a „Gemini 1.5 Pro”, amely különböző AI-benchmarkokban felülmúlja az OpenAI & Co. versenytársát.
A Geminit azonban 2024 eleje óta a Google chatbotjának is hívják, korábban Bard néven. Ez a chatbot pedig most megkapja a „Gemini Live” nevű nyelvi verziót a ChatGPT 4o legendás Voice Mode stílusában, amelyet bejelentettek. egy nappal a Google I/O előtt, 2024 májusában. Még mindig nem érhető el széles körű béta verzióban, így inkább a hátborzongató hibákról, mintsem a meglepetésszerű megjelenésről szól a címlapon.
A Gemini egyébként különféle előfizetéses modellekre is utal. Egyedül a „Gemini” az ingyenes hozzáférés a „Gemini Pro” modellen alapuló Gemini nevű Google AI-hoz. A fent említett „Gemini 1.5 Pro”-hoz azonban csak a „Gemini Advanced” előfizetési modellel férhet hozzá havi 19,99 USD-ért – vagy előfizethet a Google One AI Premiumra. Ezen a ponton nem is kezdem a Gemini Business-szel. De most az állítólagos holdraszálláshoz.
- Bővebben: Google Pixel Watch 3 – mekkora a különbség a Watch 2-höz képest?
Gemini Live: A műsor „sztárja”.
A harmincnégy különböző Ikrek mellett van még egy azonos nevű funkció, amely utat mutat a következő évek felé: a Gemini Live. Ez egy úgynevezett társalgási modell, amely lehetővé teszi a természetes beszélgetéseket – ahelyett, hogy egyszerűen körökre osztott hangüzeneteket cserélnénk az AI modellel, amelyek mindegyike szövegként vagy hangkimeneten keresztül kerül átírásra. A dinamika különbsége olyan, mintha a sakkot egy sprintversenyhez hasonlítanánk.
A „Made by Google” esemény élő demójában Jenny Blackburn egy szórakoztató és tanulságos tevékenységet kért unokahúgának és unokaöccseinek a kémia területén, beleértve a varázslatot is. A javaslatok egy mágikus vulkán, egy házi készítésű lávalámpa vagy egy láthatatlan varázstinta volt.
Jenny a bűvös tintát választotta, amely a következő beszélgetés során fekete világos tintává fejlődött, és megkapta a „Secret Message Lab” projektnevet és azt a biztosítékot, hogy a kísérletezés során nem csinál túl nagy rendetlenséget.
Kevesebb, mint a tiszta eredmény, amit a google-ban könnyen lehetett volna találni, az utazás volt az, ami igazán lenyűgöző volt. A Gemini Live segítségével az internet az Ön beszélgetőpartnere – és a jövőben a saját élete is –, amely több új funkciónak köszönhetően mostantól a Gemini AI segítségével is kereshet.
A „Hívásjegyzetek” funkció például átírja a telefonhívásait, miután tanácsot adott a beszélgetőpartnerének, és lehetővé teszi, hogy utána keressen bennük. A „Pixel Screenshots” a feltételezett fontos dolgokról készült képernyőképek elhanyagolt gyűjteményét személyes jegyzetek kereshető adatbázisává alakítja. A Workspace Extensions segítségével pedig beszélhet a Google Naptárával, valamint az e-mailekből, feladatokból vagy a Google Keepből származó adataival.
A „probléma”: a Gemini Live-hoz a Gemini 1.5 Pro erőteljes nyelvi modellre van szüksége, amely felhőben fut. Ha mesterséges intelligencia-modelleket használ a személyes Google Workspace-adatok, átiratok stb. univerzumának részleteinek kinyerésére, akkor ez csak helyileg – a Gemini Nano segítségével – történik meg. A felhőalapú Gemini 1.5 Pro esetében azonban óriási adatvédelmi hiányosság van. A Google-tól nyilatkozatot kértünk ezzel kapcsolatban, és amint visszajelzést kapunk, frissítjük a cikket.
Ikrek és az adatvédelmi szakadék
Míg a Gemini, latinul „iker”, valójában a Google két mesterségesintelligencia-laboratóriuma, a DeepMind és a Brain közötti partnerséget jelöli, a név a helyi és a felhő közötti megosztottság akaratlan leírásának is tekinthető.
Egyszerűen fogalmazva: Ha elkezd angolul chatelni a Gemini Live-val a Gemini Android-alkalmazásban (igen, természetesen az alkalmazást így hívják), az itt futó mesterséges intelligencia modell nem fér hozzá az Ön személyes adataihoz az e-mailekből, naptárból stb. És ez valószínűleg nem fog változni, amikor a következő hetekben és hónapokban a Gemini Live elérhető lesz más nyelveken, sőt iOS-re is.
Ha szeretné megkérdezni Geminit, hogy részt vehet-e egy koncerten egy plakát fényképe alapján, akkor a kőkorszakhoz hasonlóan gépelje be a lekérdezést, vagy használjon hangbevitelt. Mert bár a helyben futó Gemini Nano modell hozzáfér az Ön személyes adataihoz, nincs elég ereje a valós idejű beszélgetésekhez.
- Szintén érdekes: Google Pixel 9, Pixel 9 Pro (XL) és Pixel 9 Pro Fold összehasonlításban
A Gemini Live the Moon leszáll az „AI Race”-ben?
A 60-as és 70-es évek űrversenyében a NASA-nak volt egy „Gemini” nevű űrprogramja, amely az 1969-es, az azt követő Apollo-programmal együtt megnyitotta az első holdraszállást. Egybeesés? Aligha, mert az induláskor a Gemini Live számára elérhető tíz hang angol nyelvű neveket kapott a csillagképekhez: Vega, Dipper, Ursa & Co.
Így bár a Google a sztárokhoz nyúl, és az afterparty-ján egy ex-NASA-mérnök is színpadra áll, egy darab még mindig hiányzik a holdraszállásból. Gondosan összekovácsolt kapcsolat a helyben futó Gemini modellek legprivátabb felhasználói adatai és a természetes megjelenésű beszélgetéseket lehetővé tevő hatékony felhőmodellek között.
A Google már bejelentette a Project következő lépését Apollo Astra: Itt a Gemini Live hozzáférést kap a kamerához, ahogy azt a Google I/O-n már bemutatták, majd fokozatosan integrálja az olyan alkalmazásokat, mint a Google Calendar.