Produkto vėlavimas Silicio slėnio milžinui paprastai yra katastrofa. „Google“ atveju vieno mėnesio „Gemini 3.5 Pro“ pasirodymo nukėlimas yra ženklas, kad bendrovė pagaliau gerbia savo kūrinių sudėtingumą. Nors kai kurie terminų perkėlimą iš birželio į liepą laiko nesėkme, realybė yra praktiškesnė. Pramonė pasiekė tašką, kuriame žalia galia yra mažiau vertinga nei patikimumas. „Google“ pažadėjo „Gemini 3.5 Pro“ savo „I/O“ programuotojų konferencijoje gegužės mėnesį. Generalinis direktorius Sundar Pichai teigė, kad modelis pasirodys birželį. Dabar, mėnesio pabaigoje, bendrovė nukelia šį tikslą į liepą, kad surinktų daugiau atsiliepimų iš ankstyvųjų bandytojų.
Šis vėlavimas rodo pokytį tame, kaip technologijų bendrovės valdo DI ginklavimosi varžybas. Ankstesniais metais tikslas buvo išleisti modelį kuo greičiau, net jei jis pateikdavo keistų ar neteisingų rezultatų. Šiandien statymai yra didesni. Naudotojai tikisi, kad DI veiks kaip nenuilstantis praktikantas, galintis valdyti sudėtingas užduotis be nuolatinės priežiūros. Jei tas praktikantas padaro klaidą programavimo projekte ar finansinėje skaičiuoklėje, žala yra apčiuopiama. Skirdama papildomas keturias savaites, „Google“ bando užtikrinti, kad „Gemini 3.5 Pro“ būtų įrankis, o ne žaislas.
„Google“ sukūrė „Gemini 3.5 Pro“, kad jis pasižymėtų tuo, ką inžinieriai vadina ilgalaikėmis užduotimis (angl. long-horizon tasks). Paprastais žodžiais tariant, tai reiškia darbus, kuriems atlikti reikia daug žingsnių per ilgą laikotarpį. Dauguma dabartinių DI modelių gerai pateikia greitus atsakymus. Jūs paprašote recepto, ir jis jį pateikia. Ilgalaikės užduotys yra kitokios. Įsivaizduokite, kad prašote DI suplanuoti trijų savaičių kelionę, užsakyti skrydžius, pakoreguoti maršrutą pagal orus ir išsiųsti kalendoriaus kvietimus draugams. Tam modelis turi išlaikyti milžinišką kiekį informacijos savo aktyviojoje atmintyje nesusipainiodamas.
Už šio žargono slepiasi atminties problema. Kai DI modelis apdoroja didelį dokumentą ar ilgą pokalbį, jis naudoja tai, kas vadinama „konteksto langu“. „Google“ istoriškai pirmavo šioje srityje. Tačiau turėti didelę atmintį yra nenaudinga, jei DI negali rasti konkrečios jam reikalingos detalės. Vėlavimas rodo, kad „Google“ tobulina tai, kaip modelis išgauna informaciją iš šių gilių archyvų. Vidutiniam naudotojui tai reiškia, kad DI mažiau tikėtina haliucinuos ar išgalvos faktus, kai paprašysite apibendrinti 500 puslapių PDF dokumentą.
Praktiškai kalbant, šis patikimumas yra pagrindinis reikalavimas DI agentams. Agentas yra daugiau nei pokalbių robotas. Tai programinė įranga, kuri gali naršyti jūsų kompiuteryje ar internete, kad atliktų darbus. Jei norite, kad DI sutvarkytų jūsų mokesčių deklaracijas, jis turi būti tobulas. Vieno mėnesio vėlavimas bandymams yra maža kaina už sistemą, kuri neištrina netinkamų failų.
Šio vėlavimo kontekstas apima didelį spaudimą iš konkurentų, tokių kaip „Anthropic“ ir „OpenAI“. Nors „Google“ modeliai praėjusiais metais veikė gerai, jos konkurentai išsiveržė į priekį specifinėje srityje: kompiuterių programavime. Tai rūpi ne tik programinės įrangos inžinieriams. Programavimas yra pagrindinis būdas, kuriuo šios laboratorijos tikrina DI logiką ir samprotavimą. Jei modelis gali parašyti sudėtingą kodą, jis paprastai gali apgalvoti kitas logines problemas su panašiu tikslumu.
Žvelgiant iš rinkos pusės, programavimas yra pirmasis svarbus būdas, kuriuo bendrovės uždirba pinigus iš DI. Verslai moka už įrankius, kurie padeda jų programuotojams dirbti greičiau. Jei „Google“ atsiliks programavimo srityje, ji praras didžiulę įmonių rinkos dalį. Ankstyvieji bandytojai naudojo „Gemini 3.5 Pro“ tokiose platformose kaip „Antigravity“ ir našumo testavimo svetainėje „LMArena“. Šios aplinkos suteikia pasaulinį vaizdą apie DI našumą. Atsiliepimai tikriausiai parodė, kad nors „Gemini 3.5“ buvo greitas, jam reikėjo daugiau šlifavimo, kad nugalėtų naujausias „Claude“ ar „GPT-4o“ versijas loginio nuoseklumo srityje.
Žvelgiant į platesnį vaizdą, programavimas yra šiuolaikinės ekonomikos skaitmeninė nafta. Jis maitina viską – nuo jūsų bankininkystės programėlės iki jutiklių jūsų automobilyje. Kai „Google“ tobulina savo modelį, kad jis geriau programuotų, ji iš esmės daro visų būsimų produktų loginį pagrindą atsparesnį. Šis papildomas bandymų mėnuo leidžia bendrovei pateikti modeliui daugiau realaus pasaulio scenarijų, kuriuose ankstesnės versijos galėjo suklupti.
Viena įdomiausių liepos mėnesio vėlavimo priežasčių susijusi su mažesniu modeliu, vadinamu „Gemini 3.5 Flash“. Ši versija sukurta greičiui ir mažoms sąnaudoms. Tačiau ankstyvieji atsiliepimai parodė, kad „Flash“ vartojo žetonus (angl. tokens) per greitai. DI pasaulyje žetonas yra tarsi skaitmeninis skiemuo. Modeliai naudoja žetonus tekstui apdoroti ir generuoti. Jei modelis yra neefektyvus, jis naudoja daugiau žetonų nei reikia užduočiai atlikti. Dėl to DI tampa brangesnis kūrėjams ir lėtesnis vartotojams.
Tai reiškia, kad „Google“ bando neleisti „Gemini 3.5 Pro“ tapti „degalų rijiku“. Jei DI naudoja per daug apdorojimo galios paprastai užklausai, jis sekina jūsų nešiojamojo kompiuterio bateriją ir padidina apkrovą duomenų centrams. „Google“ perkelia „Flash“ modelio pamokas į „Pro“ modelį, kad jis taptų labiau optimizuotas. Tai apima „po kapotu“ esančios matematikos derinimą, kad modelis galėtų pasiekti tą pačią išvadą naudodamas mažiau skaičiavimo energijos.
Vidutiniam naudotojui šis efektyvumas yra decentralizuotas. Jis pasireiškia kaip greitesnis atsakymas jūsų telefone arba mažesnis mėnesinis prenumeratos mokestis už DI paslaugas. Kai modelis yra optimizuotas, jis gali veikti mažesniuose įrenginiuose be nuolatinio ryšio su milžinišku serverių ūkiu. „Google“ tikriausiai naudoja šį papildomą laiką, kad užtikrintų, jog „Pro“ modelis pateiktų geriausią intelekto ir išteklių valdymo pusiausvyrą.
Kai „Gemini 3.5 Pro“ pagaliau pasirodys liepą, poveikis bus sisteminis, o ne izoliuotas. Tikėtina, kad šiuos atnaujinimus pirmiausia pamatysite „Google Workspace“ įrankiuose, tokiuose kaip „Docs“ ir „Gmail“. Tikslas yra pereiti nuo paprasto teksto generavimo prie tikros pagalbos.
| Funkcija | Dabartinės DI galimybės | „Gemini 3.5 Pro“ tikslas |
|---|---|---|
| Atmintis | Prisimena nesenas pokalbio dalis | Išlaiko kontekstą milžiniškuose dokumentuose |
| Logika | Vykdo paprastas instrukcijas nuo A iki B | Savarankiškai sprendžia daugiapakopes problemas |
| Greitis | Greitas, bet dažnai besikartojantis | Efektyvus žetonų naudojimas mažesnei delsai |
| Agentiškumas | Siūlo veiksmus, kurių galėtumėte imtis | Atlieka veiksmus keliose programėlėse |
Žmogui, kuris kasdien naudoja „Google“ įrankius, tai reiškia, kad mygtukas „Padėk man parašyti“ taps mygtuku „Padėk man padaryti“. Užuot tik parengęs el. laiško juodraštį, DI gali peržiūrėti jūsų skaičiuoklę, apskaičiuoti likusį biudžetą ir tada parengti el. laišką jūsų vadovui. Šiam pokyčiui reikia tokio pasitikėjimo lygio, kurio „Google“ negali sau leisti sugriauti. Jei DI haliucinuoja biudžeto skaičių, naudotojas praranda tikėjimą visa sistema.
Galiausiai, vėlavimas yra bręstančios pramonės ženklas. „Judėk greitai ir laužyk viską“ era DI srityje baigiasi, nes statymai per dideli. „Google“ dabar konkuruoja nepastovioje rinkoje, kurioje reputacija yra vertingiausia valiuta. Liepos mėnesio startas leidžia jiems sutvarkyti nedidelius modelio trūkumus, kol visuomenė dar nespėjo jų rasti.
Vartotojo požiūriu, „Gemini 3.5 Pro“ laukimas turėtų būti vertinamas per skaidrumo prizmę. Praeityje technologijų bendrovės galėjo išleisti netobulą produktą ir vėliau jį taisyti atnaujinimais. Naudojant pažangiausią DI, pagrindinį modelio mokymą yra sunkiau pakeisti, kai jis jau veikia gyvai. Patobulinimai, kuriuos „Google“ daro dabar, tikriausiai yra giliai neuroniniame tinkle. Šie pakeitimai veikia tai, kaip modelis suvokia ryšius tarp idėjų.
Įdomu tai, kad šis vėlavimas taip pat gali suteikti „Google“ daugiau laiko paruošti savo techninę įrangą. DI modeliams paleisti reikia milžiniško kiekio specializuotų lustų. Nukeldama startą į liepą, „Google“ gali užtikrinti, kad jos duomenų centrai būtų pasiruošę staigiam srauto šuoliui, kurį sukelia naujo modelio išleidimas. Tai padeda išvengti erzinančių pranešimų „paslauga pasiekė maksimalų pajėgumą“, kurie dažnai lydi naujus DI leidimus.
Artėjant naujai išleidimo datai, verta stebėti, kaip šiuo metu naudojate šiuos įrankius. Dauguma žmonių naudoja DI kaip paieškos variklio pakaitalą. „Gemini 3.5 Pro“ sukurtas būti kažkuo visiškai kitu. Tai logikos variklis. Kai jis pasirodys, dėmesys bus sutelktas ne į tai, kaip gerai jis rašo eilėraštį, bet į tai, kaip gerai jis susitvarko su nematomais pramoniniais jūsų skaitmeninio gyvenimo mechanizmais. Vėlavimas nėra sunkumų patiriančios bendrovės ženklas. Tai ženklas bendrovės, kuri žino skirtumą tarp demonstracinės versijos ir patvaraus produkto.



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą