
Az utolsó Google Feature Drop-pal a Gemini Nano néven ismert mesterséges intelligencia először a Google Pixel 8 Pro-ra is megérkezett (értékelés). Mostantól használhatja a Large Language Model legkisebb verzióját a Google Recorder alkalmazásban. Mit tehet? Kezdetben a mesterséges intelligencia összefoglalót készíthet a hangfelvételeiről. Most megmutatjuk, hogyan működik ez.
-
Szeretnél még egy Google tippet? Hogyan alakíthatja át Pixel 8 készülékét a legjobb dokumentumszkennerré
Tavaly a Google kis késéssel terjesztette ki az utolsó negyedéves Pixel Feature Drop-t 2023-ra. A hangsúly elsősorban a Google Pixel 8 Pro-n volt, amely továbbfejlesztett videó módot kapott a Video Boost funkcióval. Az AI jobb képstabilizálást, kevesebb zajt és optimalizált világítást biztosít.
A Gemini Nano AI használata a Google Pixel 8 Pro készüléken
Ma egy olyan funkcióra összpontosítunk, amely csak a Google Pixel 8 Pro készüléken érhető el – a házon belüli Gemini Nano AI-re. A Google legkisebb LLM modellje offline, azaz internetkapcsolat nélkül is fut. A mesterséges intelligencia a hangfelvételek összefoglalóját készíti írásos formában. A cikk végén elmagyarázom, miért működik ez internetkapcsolat nélkül. Csak az előnézet kedvéért: A varázsszó az Android AICore.
Állítsa be a rendszer nyelvét angolra (USA)
Sajnos még mindig van egy bökkenő: a funkció csak angolul (USA) érhető el. A Google fokozatosan további nyelvi csomagokat fog szállítani az úton. Tehát ha tesztelni szeretné a Gemini Nano-t Google Pixel 8 Pro készülékén, egyszerűen állítsa be a rendszer nyelvét angolra (USA):
- Menj a beállításokhoz.
- Válassza a Rendszer lehetőséget.
- Görgessen a Nyelvek és Rendszernyelvek lehetőséghez.

Először módosítsa a nyelvet angolra (USA). / © nextpit
- Most töltse le az angol (amerikai) nyelvi csomagot (ha még nem tette meg).
- Helyezze a nyelvet az első pozícióba (ezt a két kötőjel hosszú megnyomásával teheti meg).
- Most már készen áll a Google AI Gemini Nano-jára!

A Gemini Nano jelenleg csak angol nyelven fut. / © nextpit
A Google Recorder alkalmazás
A Google már egy éve terjesztett egy Pixel Feature Drop-ot, amely lehetővé tette a felvevő alkalmazás számára a hangfelvételek átírását. A mesterséges intelligencia több hangszórót is képes volt megkülönböztetni, és párbeszédet hozott létre a felvételből. Amikor először használja a felvevőt, a Google megkérdezi, hogy szeretné-e aktiválni a hangszórófelismerést.
Rubens kollégámmal végzett kis tesztemben nem sikerült 100%-osan a várt módon, mivel mindhárom hangszórót felismerték, és az utolsó mondat, hogy “Igen, most ellenőrizzük” ismét tőlem jött (1. és 2. hangszóró). Van azonban egy figyelmeztetés: egyikünk sem anyanyelvi angol.

A személyfelismerés még nem egészen működik. / © nextpit
Első hangfelvétel és összefoglaló
A hangfelvétel összefoglalójának szöveggé alakításához a szöveg ne legyen túl rövid. Az első példámban (első felvétel) a szöveg túl rövidnek bizonyult.

Ez a hangfelvétel valószínűleg túl rövid volt az AI számára. / © nextpit
Ezután elolvastam néhány bekezdést az Amazon Echo Show 5 (2023) című áttekintésemből. Az okostelefon most a Gemini Nano AI Large Language Model-jét (LLM) is szerette volna letölteni, ami az összefoglaláshoz szükséges.

Ha elkészült a hangfelvétel és az átirat, a Gemini Nano három kulcspontot hoz létre a fájl összefoglalásával. © nextpit
Várjon egy kicsit, amíg a mesterséges intelligencia elkészíti az átiratunk összefoglalását.
- Érdekel egy másik Google Pixel tipp? Hogyan alakíthatja át Pixel telefonját webkamerává
Az LLM Gemini Nano AICore-on működik
A Gemini a Google legújabb és leghatékonyabb mesterséges intelligenciája. Alapvetően három variáció létezik:
- Gemini Ultra – a Google legnagyobb és legerősebb modellje rendkívül összetett feladatokhoz.
- Gemini Pro – a Google legjobb modellje a feladatok széles skálájához.
- Gemini Nano – a Mountain View leghatékonyabb modellje az eszközön végzett feladatokhoz.

Az Android AICore kezeli a modellt, a futásidőt és a biztonsági funkciókat. / © Google
A Gemini Nano az Android AICore nevű rendszerszolgáltatást használja. A rendszer többi részétől függetlenül működik, és nem igényel hozzáférést a hálózathoz. Ez különösen előnyös, ha olyan feladatokat hajt végre, amelyek végpontok közötti titkosítást igényelnek, mint például a WhatsApp, és hatékony adatvédelmet szeretne biztosítani.
-
Szintén érdekes: Miért a Google Pixel 8 Pro rendelkezik a legjobb okostelefon kamerával
A Gemini Nano javaslatai és válaszai nem hagyják el okostelefonját, ezért biztonságosak. Ez különösen fontos volt az „okos válasz” esetében is a Gboardban. A Fejlesztői előnézetben a Pixel 8 Pro kiváló minőségű válaszjavaslatokat közölt beszélgetési tudatossággal az olyan üzenetküldő alkalmazásokhoz, mint a Line, a KakaoTalk és a WhatsApp a Gemini Nano segítségével.
Hányan használnak már rendszeresen mesterséges intelligenciát? Melyiket használod és milyen célra? Ossza meg velünk tapasztalatait az alábbi megjegyzésekben.