Pastaruosius kelerius metus technologijų pasaulis buvo apsėstas pokalbio meno. Praleidome nesuskaičiuojamą kiekį valandų bandydami rasti tobulą užklausą, kad pokalbių robotas skambėtų žmogiškiau, geriau rašytų el. laiškus ar apibendrintų ilgą susitikimą. Mums buvo sakoma, kad skaičiavimo ateitis yra pokalbių burbulas. Tačiau kol pasaulis buvo užsiėmęs kalbėjimusi su ekranais, „Google“ ką tik davė ženklą, kad pašnekovų era baigiasi.
Pasirodžius „Gemini 3.5 Flash“, naratyvas iš esmės pasikeitė. Tai nėra geresnis pokalbių robotas; tai skaitmeninės darbo jėgos pradžia. Nors ankstesni DI modeliai atrodė kaip sudėtingesnė paieškos sistemos versija, ši nauja banga sukurta būti agentiška (angl. agentic) – šis terminas iš esmės reiškia, kad DI gali nustoti kalbėti ir pradėti veikti. Žvelgiant į platesnį vaizdą, esame liudininkai perėjimo nuo DI kaip nenuilstančio praktikanto, kuris rašosi pastabas, prie DI kaip skaitmeninių statybininkų komandos, galinčios pastatyti namą jums miegant.
Norėdami suprasti, kodėl tai svarbu, turime pažvelgti giliau už žargono. Dauguma šiandieninių DI sąveikų vyksta pagal nuspėjamą modelį: jūs užduodate klausimą, o DI pateikia atsakymą. Jei atsakymas neteisingas, jūs jį pataisote, ir jis bando dar kartą. Tai linijinis, daug dėmesio reikalaujantis procesas, kuriame žmogus vis dar turi būti pagrindinis darbo variklis.
Priešingai, agentiškas modelis, toks kaip „Gemini 3.5 Flash“, yra sukurtas veikti su minimaliu žmogaus įsikišimu. Užuot prašę jo „parašyti kodo fragmentą“, galite jam nurodyti tikslą, pavyzdžiui: „sukurk orų programėlę, kuri traukia duomenis iš trijų skirtingų šaltinių, pati pasitikrina, ar nėra klaidų, ir įkelia ją į serverį“. DI ne tik pateikia tekstinį atsakymą; jis sukuria kelis subagentus kiekvienai užduoties daliai atlikti, taiso rastas klaidas ir pateikia galutinį produktą.
Paprastai tariant, „Google“ lažinasi, kad jūs iš tikrųjų nenorite kalbėtis su savo kompiuteriu; jūs norite, kad jūsų kompiuteris pabaigtų jūsų darbų sąrašą. Tai esminis lūžis tame, kaip mes suvokiame programinę įrangą. Mes pereiname nuo įrankių, kuriems reikia piloto, prie sistemų, kurios veikia kaip jūsų skaitmeninio gyvenimo autopilotas.
Per pristatymą „I/O“ kūrėjų konferencijoje labiausiai stulbinanti statistika buvo ne DI intelekto koeficientas, o jo greitis. „Google“ vyriausiasis technologas iš „DeepMind“, Koray Kavukcuoglu, pažymėjo, kad nors standartinis „Flash“ modelis yra keturis kartus greitesnis už ankstesnius lyderius, jie sukūrė optimizuotą versiją, kuri yra 12 kartų greitesnė neaukojant kokybės.
Vidutiniam vartotojui greitis gali atrodyti kaip prabanga – būdas gauti atsakymą per pusę sekundės vietoj dviejų. Tačiau autonominiam agentui greitis yra pamatinis reikalavimas. Kitaip tariant, jei DI agentui reikia atlikti 50 mažų užduočių iš eilės, kad užbaigtų sudėtingą projektą (pavyzdžiui, ištirti rinkos tendencijas, sutikrinti duomenis ir parengti ataskaitą), lėtas modelis užtruktų valandą. Modelis, kuris yra 12 kartų greitesnis, tą pačią minčių grandinę užbaigia per penkias minutes.
Šis greitis leidžia vykdyti „lygiagretųjį apdorojimą“. Rinkos pusėje būtent tai leidžia veikti naujai „Google“ platformai „Antigravity“. Tiesioginės demonstracijos metu inžinieriai parodė, kaip agentai atsiskiria, kad vienu metu dirbtų su skirtingais operacinės sistemos komponentais. Tai ne tik greitesnis būdas rašyti; tai keičiamas (angl. scalable) būdas atlikti sudėtingą darbą.
„Google“ pristato dviejų lygių hierarchiją, kuri imituoja tradicinę įmonės struktūrą. Kai bus išleistas „Gemini 3.5 Pro“, jis veiks kaip „orkestratorius“ arba vyresnysis vadovas. Jis pasižymi stipria samprotavimo galia, leidžiančia suprasti aukšto lygio tikslus ir sudaryti strateginį planą.
Kai planas sudarytas, „Pro“ modelis deleguoja faktinį „juodą darbą“ „Gemini 3.5 Flash“. Ši sąranka yra praktiška dėl kelių priežasčių:
| Funkcija | Gemini 3.5 Flash (Darbuotojas) | Gemini 3.5 Pro (Vadovas) |
|---|---|---|
| Pagrindinis vaidmuo | Vykdymas ir subužduočių atlikimas | Strateginis planavimas ir samprotavimas |
| Greitis | 12 k. greitesnis (optimizuotas) | Subalansuotas giliam mąstymui |
| Kontekstas | Trumpo ir vidutinio nuotolio, greita iteracija | Ilgalaikis projektų valdymas |
| Geriausiai tinka | Kodavimui, duomenų gavimui, 24/7 stebėjimui | Sudėtingų problemų sprendimui, kūrybinei krypčiai |
Nors daug kas skamba taip, tarsi tai būtų skirta programinės įrangos inžinieriams, „Google“ per naują paslaugą „Gemini Spark“ šias agentiškas galimybes suteikia paprastam vartotojui. Tai asmeninis DI agentas, sukurtas veikti 24 valandas per parą, 7 dienas per savaitę.
Vidutiniam žmogui tai reiškia žingsnį už paprastų balso komandų, tokių kaip „nustatyk žadintuvą“. Asmeninis agentas, varomas „Flash“, teoriškai galėtų stebėti jūsų el. paštą dėl skrydžių vėlavimų, automatiškai susiderėti dėl pinigų grąžinimo su klientų aptarnavimo robotu ir tada iš naujo užsakyti automobilio nuomą – ir visa tai dar prieš jums pabundant patikrinti telefoną.
Istoriškai technologijos reikalavo, kad mes prisitaikytume prie jų sąsajos. Turėjome išmokti naudotis aplankais, tada paieškos juostomis, tada programėlėmis. Su „Spark“ ir agentiška integracija į paiešką, sąsaja yra tiesiog jūsų ketinimas. Jūs nurodote tikslą, o DI naršo nepermatomus interneto sluoksnius, kad jį pasiektų. Tai supaprastinta ateities vizija, tačiau ji neapsieina be sisteminių rizikų.
Egzistuoja nepastovi įtampa tarp įrankio, kuris yra naudingas, ir įrankio, kuris yra autonomiškas. „Google“ šiuo metu naršo jautrioje teisinėje aplinkoje po tragiško incidento, susijusio su vartotoju ir ankstesniu pokalbių roboto modeliu. Kai DI pereina nuo atsakymo į klausimus prie veiksmų vykdymo, žalos potencialas padidėja.
Kas nutinka, kai autonominiam agentui duodamas tikslas, tačiau jis interpretuoja kelią į tą tikslą taip, kad pažeidžia privatumą ar saugumą? „Google“ teigia sustiprinusi apsaugos priemones, ypač susijusias su kibernetiniu saugumu ir jautria medžiaga. Modelis taip pat sukurtas padaryti pauzę ir paprašyti leidimo, kai pasiekia „sprendimo tašką“.
Tačiau vartotojo požiūriu kyla pagrįstas susirūpinimas dėl skaidrumo. Jei agentas valandų valandas dirba fone, kaip mums patikrinti jo pasirinkimus? Šis pokytis reikalauja didelio pasitikėjimo įmone, kuri vis dar tobulina savo saugos protokolus. Esmė ta, kad DI tampant naudingesniam dėl savarankiško darbo, jis taip pat tampa labiau „juodąja dėže“, kurios negalime lengvai prižiūrėti realiuoju laiku.
Galiausiai, „Gemini 3.5 Flash“ išleidimas rodo, kad įžengiame į laikotarpį, kai technologijų „kaip“ yra mažiau svarbu nei „kas“. Štai kaip galite pasiruošti šiam kintančiam kraštovaizdžiui:
Mes tolstame nuo eros, kai „einame prie kompiuterio“ dirbti. Netrukus darbas vyks nuolatos, varomas skaitmeninių agentų, kuriems nereikia kavos pertraukėlių ar miego. „Gemini 3.5 Flash“ yra pirmasis tikras žvilgsnis į tą nenuilstantį ateities ekonomikos stuburą. Ar esame pasirengę pasauliui, kuriame mašinos ne tik kalba, bet ir veikia, yra klausimas, į kurį turėsime atsakyti labai greitai.
Šaltiniai:



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą