Mākslīgais intelekts

Dārgo mākslīgā intelekta programmēšanas aģentu ēra drīz beigsies

Z.ai laiž klajā GLM-5.2 — atvērtā pirmkoda MI ar 1 miljona žetonu logu, kas izstrādāts, lai krasi samazinātu izmaksas sarežģītai programmatūras inženierijai un repozitorija mēroga programmēšanai.
Dārgo mākslīgā intelekta programmēšanas aģentu ēra drīz beigsies

Lai gan tehnoloģiju pasaule bieži koncentrējas uz to, kurš mākslīgais intelekts (MI) spēj uzrakstīt radošāko dzejoli vai nokārtot jurista eksāmenu, šie etaloni neņem vērā mūsdienu programmatūras izstrādes praktisko realitāti. Lielākā daļa profesionālās programmēšanas notiek masīvos, sarežģītos projektos, kur viena izmaiņa ietekmē tūkstošiem slēpta koda rindiņu. Silīcija ielejas giganti vēlas, lai jūs ticētu, ka maksāšana par patentētu abonementu ir vienīgais veids, kā pārvaldīt šo sarežģītību. Z.ai apstrīd šo naratīvu ar GLM-5.2 — atvērtā pirmkoda modeli, kura mērķis ir samazināt augstās izmaksas par liela konteksta spriešanu.

Vēsturiski izstrādātājiem bija jāizvēlas starp jaudu un cenu. Ja vēlējāties, lai MI saprastu visu programmatūras repozitoriju, jums bija jāmaksā par augstākā līmeņa modeli, kas iekasēja papildmaksu par katru apstrādāto informācijas vienību. Z.ai maina šo scenāriju. Izlaižot GLM-5.2 saskaņā ar MIT licenci, uzņēmums nodrošina rīku, kas atbilst dārgāko sistēmu veiktspējai, vienlaikus ļaujot lietotājiem to darbināt pēc saviem noteikumiem. Šīs pārmaiņas ir kas vairāk nekā tikai cenu karš. Tās ir fundamentālas izmaiņas tajā, kā inženieru komandas var atļauties izstrādāt risinājumus plašā mērogā.

Arhitekts, kurš orientējas milzīgā rasējumu bibliotēkā

Lai saprastu, kāpēc GLM-5.2 ir svarīgs, mums jāaplūko konteksta problēma. MI terminos konteksts ir informācijas apjoms, ko modelis vienlaikus var turēt savā aktīvajā atmiņā. Ja lūdzat MI izlabot kļūdu vienā funkcijā, ar mazu konteksta logu pietiek. Tomēr, ja lūdzat tam atjaunināt visu lietojumprogrammu uz jaunu programmēšanas valodas versiju, MI ir jāsaprot, kā katrs fails ir saistīts ar citiem.

Domājiet par programmatūras kodu bāzi kā par milzīgu rasējumu bibliotēku. Standarta MI vienlaikus var skatīt tikai vienu lapu. Līdz brīdim, kad tas nonāk pie galvenās guļamistabas, tas jau ir aizmirsis priekšdurvju izmērus. GLM-5.2 ir viena miljona žetonu (token) konteksta logs. Tas ir ekvivalents arhitektam, kurš uz viena galda var izklāt katru debesskrāpja rasējumu un redzēt visu struktūru uzreiz. Šī jauda ļauj MI veikt aģentu programmēšanas darbplūsmas, kur tas darbojas kā nenogurdināms praktikants, kurš spēj orientēties tūkstošos failu, lai atrastu vienu loģisku kļūdu.

Aiz tehniskā žargona slēpjas fakts, ka spēja apstrādāt miljonu žetonu nozīmē, ka MI ir mazāka iespēja pazaudēt domu gājienu sarežģītu uzdevumu laikā. Tas var izlasīt mantotās kodu bāzes, juridiskos līgumus vai tehniskās rokasgrāmatas tūkstošiem lappušu garumā, nesadalot tekstu mazākos, nesaistītos gabalos. Šī nepārtrauktība ir būtiska programmatūras inženierijā, jo kļūdas bieži slēpjas telpā starp dažādiem moduļiem. Kad MI redz kopainu, tas pieļauj mazāk kļūdu un sniedz saskaņotākus risinājumus.

Efektivitātes problēmas risināšana ar IndexShare

Tehniskais šķērslis liela mēroga MI vienmēr ir bijušas skaitļošanas izmaksas. Katru reizi, kad MI nolasa žetonu, tas patērē noteiktu procesora jaudu. Palielinot konteksta logu līdz miljonam žetonu, šīs izmaksas parasti strauji pieaug. Z.ai ieviesa tehniku ar nosaukumu IndexShare, lai to novērstu. Praktiski runājot, šī metode samazina vienam žetonam nepieciešamo skaitļošanas jaudu par 2,9 reizēm, kad modelis darbojas ar maksimālo jaudu.

Vidējam lietotājam vai mazam uzņēmumam tas nozīmē, ka MI nav tikai gudrāks. Tas ir ātrāks un lētāks ekspluatācijā. Tirgus pusē augstās izmaksas ir kavējušas daudzus uzņēmumus izmantot MI ilgtermiņa projektos, piemēram, mantoto sistēmu modernizācijā. Ja MI veiktā vecas datubāzes sistēmas analīze API maksās simtiem dolāru, lielākā daļa vadītāju paliks pie cilvēka darba. Pazeminot skaitļošanas slieksni, GLM-5.2 pirmo reizi padara šos sarežģītos projektus finansiāli dzīvotspējīgus.

Vēl viens atjauninājums ietver spekulatīvo dekodēšanu. Tas ir process, kurā MI paredz vairākus iespējamos nākamos soļus secībā un pārbauda tos vienlaicīgi. Z.ai norāda, ka izmaiņas vairāku žetonu prognozēšanas slānī palielināja šī procesa ātrumu par 20%. Ikdienas dzīvē tas nozīmē MI, kas mazāk laika pavada domājot un vairāk — rakstot. Kad izstrādātājs gaida, kad aģents veiks repozitorija refaktorēšanu, šīs ietaupītās sekundes darba nedēļas laikā summējas ietaupītās produktivitātes stundās.

Veiktspējas etaloni pret reālo pasauli

Z.ai apgalvo, ka GLM-5.2 tagad ir tiešs konkurents lielākajiem nozares vārdiem. FrontierSWE etalonā, kas pārbauda, cik labi MI tiek galā ar ilgtermiņa programmatūras inženierijas uzdevumiem, GLM-5.2 ierindojās tikai par 1% aiz Anthropic Claude Opus 4.8. Interesantāk ir tas, ka modelis par 1% apsteidza OpenAI GPT-5.5. Lai gan šie nelielie procenti var šķist tikai akadēmisks troksnis, tie liecina par ievērojamu plaisas samazināšanos starp atvērtā pirmkoda un patentētajām tehnoloģijām.

Modelis Konteksta logs Etalona veiktspēja (FrontierSWE) Licence
Claude Opus 4.8 Augsts 1. vieta Patentēta
GLM-5.2 1 miljons žetonu 2. vieta MIT (Atvērtais pirmkods)
GPT-5.5 Augsts 3. vieta Patentēta

Raugoties uz kopainu, etalonu rezultāti ir tikai daļa no stāsta. Tulika Šīla no Kadence International atzīmēja, ka patiesais pārbaudījums ir stabilitāte. MI var nokārtot testu kontrolētā vidē, bet ciest neveiksmi, saskaroties ar nekārtīgu, nedokumentētu kodu, kas atrodams lielākajā daļā korporatīvo vidi. Lai būtu uzticama alternatīva, GLM-5.2 ir jāpierāda, ka tas spēj tikt galā ar šiem reālās pasaules scenārijiem bez halucinācijām vai lietotāja sākotnējo mērķu pazaudēšanas ilgstošu uzdevumu laikā.

Koda ģeopolitika un drošība

Tā kā Z.ai ir Ķīnas uzņēmums, saruna par GLM-5.2 ir arī saruna par drošību un pārvaldību. Rietumu uzņēmumiem ārvalstu pakalpojumu sniedzēja uzturēta MI API izmantošana ir saistīta ar riskiem, kas attiecas uz datu privātumu un nacionālās drošības likumiem. Parīkhs Džains no Pareekh Consulting minēja, ka Ķīnas noteikumi varētu pieprasīt vietējiem uzņēmumiem kopīgot datus ar valdību, ja tas tiek pieprasīts. Tas padara uzturētu pakalpojumu grūti pārdodamu tādām nozarēm kā banku darbība vai aizsardzība.

Tomēr MIT licence maina situāciju. Atšķirībā no slēgta modeļa, kas atrodas tikai konkrēta pakalpojumu sniedzēja serveros, MIT licencēts modelis ļauj uzņēmumam lejupielādēt kodu un darbināt to savā iekšējā aparatūrā. Tas sniedz lietotājam pilnīgu kontroli pār saviem datiem. Tas novērš nepieciešamību sūtīt sensitīvu intelektuālo īpašumu pāri robežām. Uzņēmumiem ar stingrām atbilstības prasībām šis atvērtā pirmkoda raksturs ir būtiska priekšrocība.

Turpretī, kā norāda Lians Džī Su no Omdia, šis kontroles jautājums neattiecas tikai uz vienu valsti. Nesenie ierobežojumi dažiem Amerikas modeļiem ir parādījuši, ka uzņēmumi Eiropā vai Āzijā arī var zaudēt piekļuvi MI pakalpojumiem vienas nakts laikā mainīgas tirdzniecības politikas dēļ. Šajā kontekstā atvērtā pirmkoda modeļi, piemēram, GLM-5.2, ir sava veida apdrošināšana. Tie piedāvā veidu, kā turpināt darbību pat tad, ja globālā tirdzniecības spriedze izraisītu pakalpojumu atslēgšanu. Šī noturība ir galvenais faktors inženieru komandām, kuras nevar atļauties, ka to galvenie rīki pazūd pēc ārvalstu valdības iegribas.

Ko tas nozīmē ikdienas izstrādātājam

Individuālam izstrādātājam vai mazas inženieru komandas vadītājam GLM-5.2 ierašanās ir signāls, ka augstākās klases MI rīki kļūst demokratizēti. Jums vairs nav nepieciešams milzīgs budžets, lai eksperimentētu ar repozitorija mēroga MI aģentiem. Jūs varat darbināt šos modeļus lokālajos serveros vai privātajos mākoņos, lai auditētu žurnālus, modernizētu vecu kodu vai ģenerētu sarežģītu dokumentāciju. Tas pazemina ienākšanas barjeru maziem uzņēmumiem, kas vēlas konkurēt ar lielākiem uzņēmumiem tehniskās efektivitātes ziņā.

Galu galā viena miljona žetonu konteksta loga vērtība ir atkarīga no tā, kā jūs to izmantojat. Vienkāršiem, ikdienas programmēšanas uzdevumiem bieži vien pietiek ar mazāku un ātrāku modeli ar labu informācijas izgūšanas sistēmu. Bet dziļam, strukturālam programmatūras inženierijas darbam spēja redzēt visu sistēmu ir fundamentālas pārmaiņas. GLM-5.2 pierāda, ka nākamo MI revolūcijas posmu noteiks ne tikai tas, cik daudz modelis zina, bet gan tas, cik ilgi tas spēj koncentrēties uz vienu masīvu uzdevumu. Tā ir MI progresa praktiskā puse.

Avoti: Z.ai oficiālais tehniskais paziņojums, Omdia tirgus analīze, Pareekh Consulting nozares ziņojums, Kadence International uzņēmumu pētījums.

bg
bg
bg

Uz tikšanos otrā pusē.

Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.

/ Izveidot bezmaksas kontu