Pēdējo pāris gadu laikā tehnoloģiju pasaule ir bijusi apsēsta ar sarunas mākslu. Mēs esam pavadījuši neskaitāmas stundas, mēģinot atrast perfektu uzvedni, lai tērzēšanas robots izklausītos cilvēcīgāks, uzrakstītu labāku e-pastu vai apkopotu garu sanāksmi. Mums teica, ka skaitļošanas nākotne ir tērzēšanas burbulis. Taču, kamēr pasaule bija aizņemta, sarunājoties ar ekrāniem, Google tikko deva signālu, ka sarunu biedru ēra beidzas.
Līdz ar Gemini 3.5 Flash palaišanu naratīvs ir fundamentāli mainījies. Šis nav vienkārši labāks tērzēšanas robots; tas ir digitālā darbaspēka sākums. Lai gan iepriekšējie MI modeļi šķita kā sarežģītākas meklētājprogrammu versijas, šis jaunais vilnis ir izstrādāts tā, lai būtu aģentisks (agentic) — termins, kas faktiski nozīmē, ka MI var pārtraukt runāt un sākt darīt. Raugoties uz kopējo ainu, mēs esam liecinieki pārejai no MI kā nenogurdināma praktikanta, kurš veic pierakstus, uz MI kā digitālo celtnieku komandu, kas spēj uzbūvēt māju, kamēr jūs guļat.
Lai saprastu, kāpēc tas ir svarīgi, mums jāieskatās aiz žargona. Lielākā daļa MI mijiedarbību mūsdienās seko paredzamam paraugam: jūs uzdodat jautājumu, un MI sniedz atbildi. Ja atbilde ir nepareiza, jūs to izlabojat, un tas mēģina vēlreiz. Tas ir lineārs, augstas iesaistes process, kurā cilvēkam joprojām ir jābūt galvenajam darba dzinējam.
Turpretim aģentisks modelis, piemēram, Gemini 3.5 Flash, ir izstrādāts tā, lai darbotos ar minimālu cilvēka ieguldījumu. Tā vietā, lai lūgtu tam "uzrakstīt koda gabalu", jūs varētu tam dot mērķi, piemēram, "izveidot laikapstākļu lietotni, kas iegūst datus no trim dažādiem avotiem, pārbauda kļūdas un izvieto to serverī". MI ne tikai sniedz jums teksta atbildi; tas izveido vairākus apakšaģentus, lai apstrādātu katru uzdevuma daļu, labo atrastās kļūdas un prezentē gatavu produktu.
Vienkāršiem vārdiem sakot, Google liek likmi uz to, ka jūs patiesībā nevēlaties sarunāties ar savu datoru; jūs vēlaties, lai dators pabeidz jūsu darāmo darbu sarakstu. Šī ir graujoša maiņa tajā, kā mēs uztveram programmatūru. Mēs pārejam no rīkiem, kuriem nepieciešams pilots, uz sistēmām, kas darbojas kā autopilots jūsu digitālajai dzīvei.
I/O izstrādātāju konferences paziņojuma laikā spilgtākā statistika nebija MI intelekta koeficients, bet gan tā ātrums. Google DeepMind galvenais tehnologs Korajs Kavukčuoglu (Koray Kavukcuoglu) atzīmēja, ka, lai gan standarta Flash modelis ir četras reizes ātrāks par iepriekšējiem līderiem, viņi ir izstrādājuši optimizētu versiju, kas ir 12 reizes ātrāka, nezaudējot kvalitāti.
Vidējam lietotājam ātrums var šķist greznība — veids, kā saņemt atbildi pussekundē, nevis divās. Taču autonomam aģentam ātrums ir pamatprasība. Citiem vārdiem sakot, ja MI aģentam ir jāveic 50 mazi uzdevumi pēc kārtas, lai pabeigtu sarežģītu projektu (piemēram, tirgus tendenču izpēte, datu salīdzināšana un ziņojuma sagatavošana), lēnam modelim būtu nepieciešama stunda, lai to pabeigtu. Modelis, kas ir 12 reizes ātrāks, pabeidz to pašu domas ķēdi piecās minūtēs.
Šis ātrums pieļauj "paralēlo apstrādi". Tirgus pusē tas ir tas, kas ļauj darboties Google jaunajai platformai Antigravity. Tiešraides demonstrācijā inženieri parādīja, kā aģenti vienlaikus sāk darbu pie dažādiem operētājsistēmas komponentiem. Tas nav tikai ātrāks veids, kā rakstīt; tas ir mērogojams veids, kā veikt sarežģītu darbu.
Google ievieš divu līmeņu hierarhiju, kas atdarina tradicionālo korporatīvo struktūru. Kad tiks izlaists Gemini 3.5 Pro, tas darbosies kā "orķestrētājs" jeb vecākais vadītājs. Tam piemīt spēcīgas spriešanas spējas, lai saprastu augsta līmeņa mērķus un izveidotu stratēģisko plānu.
Kad plāns ir noteikts, Pro modelis deleģē faktisko "rupja spēka" darbu Gemini 3.5 Flash. Šāda uzstādīšana ir praktiska vairāku iemeslu dēļ:
| Funkcija | Gemini 3.5 Flash (Strādnieks) | Gemini 3.5 Pro (Vadītājs) |
|---|---|---|
| Galvenā loma | Izpilde un apakšuzdevumu pabeigšana | Stratēģiskā plānošana un spriešana |
| Ātrums | 12x ātrāks (optimizēts) | Līdzsvarots dziļām pārdomām |
| Konteksts | Īsa un vidēja diapazona, ātrdarbīga iterācija | Ilgtermiņa projektu vadība |
| Piemērotākais | Kodēšanai, datu izgūšanai, 24/7 uzraudzībai | Sarežģītu problēmu risināšanai, radošajai vadībai |
Lai gan liela daļa no tā izklausās pēc programmatūras inženieriem paredzēta satura, Google nodod šīs aģentiskās spējas patērētājiem, izmantojot jaunu pakalpojumu Gemini Spark. Šis ir personīgais MI aģents, kas paredzēts darbam 24/7.
Vidusmēra cilvēkam tas nozīmē atteikšanos no vienkāršām balss komandām, piemēram, "iestatīt modinātāju". Personīgais aģents, ko darbina Flash, teorētiski varētu pārraudzīt jūsu e-pastus, lai meklētu informāciju par lidojumu kavēšanos, automātiski vienoties par naudas atmaksu ar klientu apkalpošanas robotu un pēc tam rezervēt citu automašīnu nomu — tas viss pirms jūs pat esat pamodies, lai pārbaudītu tālruni.
Vēsturiski tehnoloģijas ir pieprasījušas mums pielāgoties to saskarnei. Mums bija jāmācās lietot mapes, tad meklēšanas joslas, tad lietotnes. Ar Spark un aģentisko integrāciju meklēšanā saskarne ir vienkārši jūsu nodoms. Jūs norādāt mērķi, un MI pārvietojas pa nepārredzamajiem interneta slāņiem, lai to sasniegtu. Šis ir racionalizēts nākotnes redzējums, taču tas nav bez sistēmiskiem riskiem.
Pastāv svārstīga spriedze starp rīku, kas ir noderīgs, un rīku, kas ir autonoms. Google pašlaik orientējas jutīgā juridiskajā vidē pēc traģiska incidenta, kurā bija iesaistīts lietotājs un tā iepriekšējais tērzēšanas robota modelis. Kad MI pāriet no atbildēšanas uz jautājumiem uz darbību veikšanu, kaitējuma iespējamība palielinās.
Kas notiek, ja autonomam aģentam tiek dots mērķis, bet tas interpretē ceļu uz šo mērķi tādā veidā, kas pārkāpj privātumu vai drošību? Google apgalvo, ka ir pastiprinājusi aizsardzības pasākumus, jo īpaši attiecībā uz kiberdrošību un jutīgiem materiāliem. Modelis ir arī izstrādāts tā, lai apstātos un lūgtu atļauju, kad tas sasniedz "lēmuma punktu".
Tomēr no patērētāja viedokļa pastāv pamatotas bažas par pārredzamību. Ja aģents stundām ilgi strādā fonā, kā mēs varam auditēt tā izvēles? Šī pāreja prasa augstu uzticības līmeni uzņēmumam, kas joprojām pilnveido savus drošības protokolus. Būtība ir tāda, ka, MI kļūstot noderīgākam, strādājot neatkarīgi, tas kļūst arī par "melno kasti", kuru mēs nevaram viegli pārraudzīt reāllaikā.
Galu galā Gemini 3.5 Flash izlaišana liecina, ka mēs ieejam periodā, kurā tehnoloģiju "kā" ir mazāk svarīgs nekā "kas". Lūk, kā jūs varat sagatavoties šai mainīgajai videi:
Mēs attālināmies no ēras, kurā mēs "ejam pie datora", lai strādātu. Drīz darbs notiks nepārtraukti, un to nodrošinās digitālie aģenti, kuriem nav vajadzīgi kafijas pārtraukumi vai miegs. Gemini 3.5 Flash ir pirmais reālais ieskats šajā nenogurdināmajā nākotnes ekonomikas mugurkaulā. Vai mēs esam gatavi pasaulei, kurā mašīnas ne tikai runā, bet arī rīkojas, ir jautājums, uz kuru mums būs jāatbild pavisam drīz.
Avoti:



Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.
/ Izveidot bezmaksas kontu