„Google” asmeninio DI lūžis: „Gemini” ir „Nano Banana” jungsis prie vartotojo nuotraukų
„Google“ leidžia dirbtinio intelekto pokalbių robotui „Gemini“ prisijungti prie asmeninių nuotraukų ir naudoti jas kartu su vaizdų generavimo įrankiu „Nano Banana“.
Ketvirtadienį „Google“ pranešė, kad vartotojai galės susieti „Personal Intelligence“ – DI funkciją, kuri sujungia „Google“ programėles ir pateikia labiau suasmenintus atsakymus – su „Gemini“ pokalbių robotu.
Jei vartotojas sutiks (opt-in), „Nano Banana“ galės kurti asmeninius vaizdus remdamasis privačia „Google Photos“ biblioteka, todėl nuotraukų nebereikės rankiniu būdu įkelti į pokalbių robotą.
Pasak bendrovės, žmogus galės paprašyti, pavyzdžiui, sukurti animacijos stiliaus vaizdą, kuriame jis su šeima užsiima mėgstama veikla, o „Gemini“ tokį vaizdą sugeneruos automatiškai.
„Nano Banana“ sulaukė didelio dėmesio dar pernai, kai žmonės ėmė kelti asmenines nuotraukas ir kurti skaitmenines miniatiūrines savo figūrėles. Populiarumas buvo toks didelis, kad laikinai teko riboti naudojimą, nes buvo perkrauta infrastruktūra ir specialiai „Google“ sukurti lustai – tensoriniai apdorojimo įrenginiai (TPU).
Tuo metu „Gemini“ programėlė pakilo į pirmą vietą „Apple“ programėlių parduotuvėje, aplenkdama „OpenAI“ programą „ChatGPT“.
Vis dėlto, kaip pabrėžiama, galimybė tiesiogiai susieti DI įrankį su vartotojo nuotraukų biblioteka yra dar didesnis žingsnis kuriant pokalbių robotų ryšį su privačia informacija.
„Google“ nurodė, kad norint prijungti „Google“ programėles prie „Gemini“ ir jo funkcijos „Nano Banana“, vartotojai turės įjungti „Personal Intelligence“. Suasmeninto vaizdų generavimo galimybė artimiausiomis dienomis bus diegiama mokamiems prenumeratoriams.
Bendrovė teigia, kad „Gemini“ programėlė tiesiogiai nemoko savo modelių iš privačios „Google Photos“ bibliotekos turinio, tačiau naudoja „ribotą informaciją“, pavyzdžiui, konkrečias vartotojo užklausas „Gemini“ ir modelio atsakymus.
Taip pat nurodoma, kad „Gemini“ gali pasitelkti informaciją apie žmones, pažymėtus „Google Photos“ nuotraukose.
„Dabar jūsų artimiausias ratas gali tapti jūsų vaizdų žvaigždėmis – nesvarbu, ar norite rezultato, kuris atrodytų lyg iš jūsų gyvenimo, ar tokio, kuris jūsų vaizduotę nuvestų dar toliau“, – teigia „Google“.
Įmonė pridūrė, kad dėl to, jog suasmenintas vaizdų generavimas yra nauja patirtis, „Gemini“ „ne visada iš pirmo karto parinks būtent tą nuotrauką ar detalę, kurią turėjote omenyje“.
„Google“ produktų sujungimas rodo siekį kurti vis asmeniškesnį DI ryšį su vartotojais: vartotojo duomenys ir pasirinkimai gali formuoti ne tik tekstinius atsakymus, bet ir vizualinį rezultatą.
„Google“ „Personal Intelligence“ pristatė sausį. „Nano Banana 2“ pasirodė vasarį – bendrovė teigė padidinusi greitį, patobulinusi teksto atvaizdavimą ir tiksliau vykdanti nurodymus.