Viimastel aastatel on tehnoloogiamaailm olnud lummatud vestluskunstist. Oleme kulutanud lugematuid tunde, püüdes leida täiuslikku viipa, et panna juturobot kõlama inimlikumalt, kirjutama paremat e-kirja või võtma kokku pikka koosolekut. Meile öeldi, et arvutite tulevik on vestlusmull. Kuid ajal, mil maailm oli hõivatud ekraanidega rääkimisega, andis Google märku, et vestleja ajastu on lõppemas.
Gemini 3.5 Flashi tulekuga on narratiiv põhjalikult muutunud. See ei ole parem juturobot; see on digitaalse tööjõu algus. Kui varasemad tehisintellekti mudelid tundusid otsingumootori keerukama versioonina, siis see uus laine on loodud olema agentne (agentic) — termin, mis sisuliselt tähendab, et tehisintellekt võib lõpetada rääkimise ja hakata tegutsema. Suurt pilti vaadates oleme tunnistajaks üleminekule tehisintellektilt kui väsimatult praktikandilt, kes teeb märkmeid, tehisintellektile kui digitaalsete ehitustööliste meeskonnale, kes on võimeline ehitama maja sel ajal, kui te magate.
Mõistmaks, miks see oluline on, peame vaatama žargooni taha. Enamik tänapäevaseid tehisintellekti interaktsioone järgib ennustatavat mustrit: esitate küsimuse ja tehisintellekt annab vastuse. Kui vastus on vale, parandate seda ja see proovib uuesti. See on lineaarne, suure sekkumisvajadusega protsess, mis nõuab endiselt inimeselt peamise mootorina tegutsemist.
Vastupidiselt sellele on agentne mudel nagu Gemini 3.5 Flash loodud toimima minimaalse inimese panusega. Selle asemel, et paluda tal "kirjutada koodijupp", võite anda talle eesmärgi nagu "ehita ilmarakendus, mis võtab andmeid kolmest erinevast allikast, testib end vigade suhtes ja juurutab selle serverisse". Tehisintellekt ei anna teile lihtsalt tekstivastust; see loob mitu alamagenti ülesande iga osa käsitlemiseks, õpib leitud vigadest ja esitab valmistoote.
Lihtsamalt öeldes panustab Google sellele, et te tegelikult ei soovi oma arvutiga rääkida; te soovite, et arvuti lõpetaks teie ülesannete nimekirja. See on murranguline muutus selles, kuidas me tarkvara tajume. Liigume tööriistadelt, mis vajavad pilooti, süsteemidele, mis toimivad teie digitaalse elu autopiloodina.
I/O arendajate konverentsil tehtud teadaande ajal ei olnud kõige rabavam statistika mitte tehisintellekti IQ, vaid selle kiirus. Google’i DeepMindi peatehnoloog Koray Kavukcuoglu märkis, et kuigi standardne Flash-mudel on neli korda kiirem kui eelmised liidrid, on nad välja töötanud optimeeritud versiooni, mis on 12 korda kiirem ilma kvaliteeti ohverdamata.
Keskmise kasutaja jaoks võib kiirus tunduda luksusena — viisina saada vastus poole sekundi asemel kahega. Kuid autonoomse agendi jaoks on kiirus alusnõue. Teisisõnu, kui tehisintellekti agent peab keeruka projekti lõpuleviimiseks (näiteks turusuundumuste uurimine, andmete ristviitamine ja aruande koostamine) sooritama järjest 50 väikest ülesannet, kuluks aeglasel mudelil lõpetamiseks tund. Mudel, mis on 12 korda kiirem, lõpetab sama mõtteahela viie minutiga.
See kiirus võimaldab "paralleeltöötlust". Turu poolel on see see, mis võimaldab Google’i uuel platvormil Antigravity toimida. Otseülekandes näitasid insenerid, kuidas agendid hargnevad, et töötada samaaegselt operatsioonisüsteemi erinevate komponentidega. See ei ole lihtsalt kiirem viis trükkimiseks; see on skaleeritav viis keeruka töö teostamiseks.
Google tutvustab kahetasandilist hierarhiat, mis imiteerib traditsioonilist ettevõtte struktuuri. Kui Gemini 3.5 Pro välja tuleb, tegutseb see "orkestreerijana" ehk vanemjuhina. Sellel on tugev arutlusvõime, et mõista kõrgetasemelisi eesmärke ja luua strateegiline plaan.
Kui plaan on paigas, delegeerib Pro mudel tegeliku "toore jõu" töö Gemini 3.5 Flashile. See seadistus on praktiline mitmel põhjusel:
| Funktsioon | Gemini 3.5 Flash (Tööline) | Gemini 3.5 Pro (Juht) |
|---|---|---|
| Peamine roll | Täitmine ja alamülesannete lõpetamine | Strateegiline planeerimine ja arutlus |
| Kiirus | 12x kiirem (optimeeritud) | Tasakaalustatud sügavaks mõttetööks |
| Kontekst | Lühike kuni keskmine vahemik, kiire iteratsioon | Pikaajaline projektijuhtimine |
| Parim | Kodeerimiseks, andmete hankimiseks, 24/7 seireks | Keeruliste probleemide lahendamiseks, loominguliseks suunamiseks |
Kuigi suur osa sellest kõlab nagu tarkvarainseneridele suunatud teema, toob Google need agentsed võimekused tarbijani uue teenuse kaudu nimega Gemini Spark. See on isiklik tehisintellekti agent, mis on loodud töötama ööpäevaringselt.
Keskmise inimese jaoks tähendab see liikumist lihtsatest häälkäsklustest nagu "seadista äratus" kaugemale. Flashi toel töötav isiklik agent võiks teoreetiliselt jälgida teie e-kirju lendude hilinemise suhtes, pidada klienditeeninduse robotiga automaatselt läbirääkimisi raha tagastamiseks ja seejärel broneerida uue autorendi — seda kõike enne, kui olete isegi ärganud, et oma telefoni kontrollida.
Ajalooliselt on tehnoloogia nõudnud meilt selle liidesega kohanemist. Pidi õppima kasutama kaustu, seejärel otsinguribasid, seejärel rakendusi. Sparki ja agentse integratsiooniga otsingusse on liideseks lihtsalt teie kavatsus. Teie esitate eesmärgi ja tehisintellekt navigeerib interneti läbipaistmatutes kihtides selle saavutamiseks. See on voolujooneline visioon tulevikust, kuid see ei tule ilma süsteemsete riskideta.
Abivalmi tööriista ja autonoomse tööriista vahel on plahvatusohtlik pinge. Google navigeerib praegu tundlikul õigusmaastikul pärast traagilist intsidenti, mis puudutas kasutajat ja selle eelmist juturoboti mudelit. Kui tehisintellekt liigub küsimustele vastamiselt tegevuste sooritamisele, suureneb kahju tekkimise potentsiaal.
Mis juhtub, kui autonoomsele agendile antakse eesmärk, kuid ta tõlgendab teed selle eesmärgini viisil, mis rikub privaatsust või ohutust? Google väidab, et on tugevdanud oma kaitsemeetmeid, eriti küberjulgeoleku ja tundlike materjalide osas. Mudel on loodud ka peatuma ja luba küsima, kui see jõuab "otsustuspunktini".
Tarbija seisukohast on aga õigustatud mure läbipaistvuse pärast. Kui agent töötab taustal tunde, siis kuidas me saame selle valikuid auditeerida? See muutus nõuab suurt usaldust ettevõtte vastu, mis alles täiustab oma ohutusprotokolle. Lõpptulemus on see, et kui tehisintellekt muutub iseseisvalt töötades kasulikumaks, muutub see ka rohkem "mustaks kastiks", mida me ei saa reaalajas hõlpsasti jälgida.
Lõppkokkuvõttes viitab Gemini 3.5 Flashi väljalaskmine sellele, et oleme sisenemas perioodi, kus tehnoloogia "kuidas" on vähem oluline kui "mida". Siin on, kuidas saate selleks muutuvaks maastikuks valmistuda:
Me liigume eemale ajastust, kus me "läheme arvutisse", et tööd teha. Varsti toimub töö pidevalt, toidetuna digitaalsetest agentidest, kes ei vaja kohvipause ega und. Gemini 3.5 Flash on esimene tõeline pilk sellele tuleviku majanduse väsimatule selgroole. Kas me oleme valmis maailmaks, kus masinad mitte ainult ei räägi, vaid ka tegutsevad, on küsimus, millele peame vastama väga varsti.
Allikad:



Meie läbivalt krüpteeritud e-posti ja pilvesalvestuse lahendus pakub kõige võimsamaid vahendeid turvaliseks andmevahetuseks, tagades teie andmete turvalisuse ja privaatsuse.
/ Tasuta konto loomin