Dirbtinis intelektas

Ar nemokamas kinų DI modelis iš tiesų gali pranokti „OpenAI“?

Susipažinkite su GLM-5.2 – naujuoju atvirojo kodo DI iš Kinijos, kuris meta iššūkį „OpenAI“ su 1 milijono žetonų konteksto langu ir elitiniais programavimo įgūdžiais.
Ar nemokamas kinų DI modelis iš tiesų gali pranokti „OpenAI“?

Nors Silicio slėnyje vyrauja nuomonė, kad milžiniškas kapitalas ir uždaras vystymas yra vieninteliai keliai į dirbtinį intelektą, realybė keičiasi. Metų metus tokios įmonės kaip „OpenAI“ ir „Anthropic“ užtikrintai pirmavo, saugomos milijardus dolerių kainuojančių serverių ūkių ir patentuoto kodo. Ši lyderystė nebėra garantuota. Kinijos įmonės „z.AI“ išleistas „GLM-5.2“ modelis sukėlė susirūpinimo bangą tarp Amerikos technologijų lyderių. Šis modelis yra tiesioginis iššūkis idėjai, kad geriausia technologija būtinai turi būti brangi, ribojama ir amerikietiška.

„GLM-5.2“ pasirodo tuo metu, kai DI pramonė pasiekia prisotinimo tašką su paprastomis susirašinėjimo sąsajomis. Vartotojai palieka už nugaros naujovės žavesį, kai boto prašoma parašyti eilėraštį, ir dabar reikalauja modelių, galinčių atlikti realų darbą. Būtent čia „z.AI“ pozicionuoja savo naujausią kūrinį. Tai yra atvirojo kodo modelis, o tai reiškia, kad pagrindinis kodas yra prieinamas kiekvienam atsisiųsti, patikrinti ir paleisti savo aparatinėje įrangoje. Pasaulyje, kuriame dauguma pažangiausių modelių yra nuomojami kaip brangios komunalinės paslaugos, „GLM-5.2“ yra tarsi aukščiausios klasės elektrinių įrankių rinkinys, kurį jūs iš tikrųjų turite nuosavybės teise.

Didžiulė skaitmeninė dokumentų spinta „GLM-5.2“ viduje

Norėdami suprasti, kodėl šis modelis patraukė vadovų ir inžinierių dėmesį, pažvelkite į jo konteksto langą. Paprastais žodžiais tariant, konteksto langas yra informacijos kiekis, kurį DI gali vienu metu išlaikyti savo aktyvioje atmintyje. Jei įsivaizduotumėte DI kaip nenuilstantį praktikantą, konteksto langas būtų jo darbo stalo dydis. Jei stalas mažas, praktikantas turi nuolat keisti popierius, traukdamas juos iš dokumentų spintos ir dėdamas atgal, o tai lemia klaidas ir informacijos praradimą.

„GLM-5.2“ turi 1 milijono žetonų konteksto langą. Praktiškai tai reiškia, kad modelis gali perskaityti, išanalizuoti ir įsiminti maždaug 750 000 žodžių vienos sesijos metu. Tai pastato jį į vieną gretą su „GPT-5.5“ ir „Claude 4.8“. Programuotojui tai iš esmės keičia žaidimo taisykles. Jie gali pateikti DI visą programinės įrangos projektą, susidedantį iš tūkstančių failų, ir paprašyti rasti konkrečią klaidą. DI nepamiršta kodo pradžios, kol pasiekia pabaigą. Šis gebėjimas atlikti ilgą loginį mąstymą leidžia kurti agentines darbo eigas, kuriose DI atlieka sudėtingų užduočių sekas be žmogaus pagalbos.

Kodėl programavimas yra pagrindinis DI logikos išbandymas

Programavimas yra sunkiausia užduotis dideliam kalbos modeliui, nes čia nėra vietos kūrybiškai interpretacijai. Jei kablelis padėtas netinkamoje vietoje, programa neveikia. Guillermo Rauch, „Vercel“ vadovas, pažymėjo, kad jį šokiravo „GLM-5.2“ programavimo meistriškumas. Šis jausmas bendras tarp ankstyvųjų vartotojų, kurie pastebi, kad modelis su logika tvarkosi geriau nei daugelis jo uždarojo kodo konkurentų.

Kai DI rašo kodą, jis iš esmės sprendžia milžinišką logikos galvosūkį. Aukštos kokybės programavimo rezultatai rodo, kad modelis giliai supranta struktūrą bei priežasties ir pasekmės ryšius. Tai daro jį naudingą ne tik programinės įrangos inžinerijai. Modelis, kuris gerai programuoja, paprastai puikiai atlieka teisinę analizę, finansinį modeliavimą ir bet kurią kitą užduotį, reikalaujančią griežto taisyklių laikymosi. Vidutiniam vartotojui tai reiškia, kad įrankiai, kuriuos jie naudoja kasdieniam produktyvumui — pavyzdžiui, skaičiuoklės, kurios užsipildo pačios, arba programėlės, automatizuojančios el. paštą — taps žymiai patikimesni.

Kaip atvirojo kodo modeliai nutraukia nuomos ciklą

Istoriškai technologijų pramonė svyravo tarp atvirų ir uždarų sistemų. Šiuo metu galingiausi DI modeliai yra uždari. Jūs mokate kasmėnesinę prenumeratą „OpenAI“ ar „Anthropic“, kad galėtumėte naudotis jų intelektu. Jūs niekada nematote, kaip modelis veikia, ir negalite jo paleisti savo serveriuose. Tai itin pelningas modelis teikėjams, nes jis sukuria pasikartojančias pajamas ir išlaiko vartotoją priklausomą nuo jų infrastruktūros.

Atvirojo kodo modeliai, tokie kaip „GLM-5.2“, sutrikdo šį ciklą. Kai modelis yra atvirojo kodo, įmonė gali jį atsisiųsti ir paleisti savo vidinėje aparatinėje įrangoje. Tai būtina tokioms pramonės šakoms kaip sveikatos apsauga ar finansai, kur duomenų privatumas yra svarbiausias. Jiems nereikia siųsti jautrių pacientų įrašų ar komercinių paslapčių į trečiosios šalies serverį debesyje. Be to, jiems nereikia mokėti mokesčio kiekvieną kartą, kai jie užduoda DI klausimą. Kai tik jie turi aparatinę įrangą, intelektas iš esmės tampa nemokamas. Šis aukščiausios klasės DI demokratizavimas mažina patekimo barjerą startuoliams ir mažoms įmonėms, kurios negali sau leisti didžiulių prenumeratos išlaidų.

Distiliavimo strategija ir mažėjantis atotrūkis

Išlieka klausimas, kaip Kinijos įmonės neatsilieka, nepaisant JAV apribojimų aukščiausios klasės mikroschemoms. Atsakymas slypi technikoje, vadinamoje distiliavimu. Įsivaizduokite tai kaip studentą, kuris darosi kruopščius užrašus klausydamasis pasaulinio lygio profesoriaus. Įmonė gali paimti milžinišką, brangų modelį ir naudoti jį mokyti mažesnį, efektyvesnį „studento“ modelį. Šis studento modelis išmoksta didesniojo modelio dėsningumus ir logiką, tačiau jo veikimui reikia kur kas mažiau skaičiavimo galios.

„Anthropic“ išreiškė susirūpinimą, kad šis procesas leidžia Kinijai panaikinti atotrūkį tarp pažangiausių galimybių. Naudodamos distiliavimą ir kitas į efektyvumą orientuotas technikas, Kinijos įmonės pasiekia daugiau su mažesniais ištekliais. Jos kuria modelius, kurie yra ekonomiški ir greiti, todėl juos lengviau įdiegti standartinėje vartotojų įrangoje. Šis pokytis rodo, kad grynas lustų skaičius, kurį turi šalis, nebėra vienintelis DI viršenybės rodiklis. Intelektinis efektyvumas tampa toks pat svarbus kaip ir žalia skaičiavimo galia.

Ką tai reiškia jūsų skaitmeniniam biudžetui

Vidutiniam vartotojui „GLM-5.2“ pasirodymas yra gera žinia piniginei. Kai į rinką ateina aukštos kokybės nemokama alternatyva, mokamų paslaugų teikėjai yra priversti reaguoti. Tai matėme ankstyvosiomis interneto dienomis su naršyklėmis ir el. pašto paslaugomis. Kai atvirojo kodo modeliai tampa tokie pat pajėgūs kaip jų mokami atitikmenys, DI kaina visur greičiausiai kris.

Žvelgiant plačiau, tai taip pat reiškia, kad DI tampa decentralizuota preke, o ne centralizuota prabanga. Netrukus turėsite galimybę paleisti pasaulinio lygio DI tiesiogiai savo nešiojamajame kompiuteryje ar telefone be interneto ryšio. Tai suteikia tokį atsparumo ir privatumo lygį, kuris anksčiau buvo neįmanomas. Jūs nebesate priklausomi nuo vienos įmonės paslaugų teikimo sąlygų ar kainų lygių.

Pagrindinė išvada apie pasaulines DI lenktynes

Galiausiai, „GLM-5.2“ iškilimas rodo, kad DI lenktynės yra maratonas, o ne sprintas. Nors JAV šiuo metu pirmauja pagal bendrą pažangiausių modelių skaičių, atotrūkis mažėja dėl gryno inžinerinio išradingumo ir atsidavimo atvirojo kodo filosofijai. Klausimas, ar Silicio slėnio lyderystė yra saugi, nebėra teorinė investuotojų diskusija. Į jį realiuoju laiku atsako programuotojai, kurie savo kasdienes darbo eigas perkelia į modelius, sukurtus už tūkstančių kilometrų.

Praktiškai kalbant, turėtumėte pradėti ieškoti DI įrankių, siūlančių vietinį vykdymą arba atvirojo kodo pagrindus. Visagalio, centralizuoto DI teikėjo era nesibaigia, tačiau ji tikrai susiduria su pirmuoju rimtu iššūkiu. Kaip vartotojo, jūsų galia slypi platformų pasirinkime. Jei nemokamas, atviras modelis gali atlikti mokamo, uždaro modelio darbą, rinka neišvengiamai paseks verte. Galite pastebėti, kad jūsų naudingiausias skaitmeninis asistentas ateinančiais metais bus tas, kuris gyvena jūsų įrenginyje, atsiskaito tik jums ir nieko nekainuoja.

Šaltiniai:

  • z.AI (Zhipu AI) techninė ataskaita apie GLM-5 seriją
  • Vercel vadovo vieši pareiškimai platformoje X (buvęs Twitter)
  • Anthropic politikos ataskaita apie pažangiausio DI vystymą
  • DeepSeek R1 našumo testai ir rinkos poveikio analizė
bg
bg
bg

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą