Lielāko daļu no pēdējiem pieciem gadiem mākslīgā intelekta nozare ir bijusi iesprostota augstu likmju bruņošanās sacensībās, kur vienīgais rādītājs, kam šķita nozīme, bija izmērs. Ja modelim bija 100 miljardi parametru, nākamajam vienkārši bija jābūt ar triljonu. Mums teica, ka lielāks pēc būtības ir labāks, ka vairāk datu nozīmē vairāk gudrības un ka vienīgais veids, kā sasniegt patiesu digitālo intelektu, ir veidot arvien masīvākas, enerģiju patērējošas silīcija smadzenes.
Lai gan šis naratīvs liecina, ka neapstrādāts mērogs ir galvenais mērķis, realitāte uz vietas mainās. IBM Granite 4.1 izlaišana — konkrēti tā 8B (astoņu miljardu parametru) variants — ir apzināts "vidējais pirksts" filozofijai "lielāks ir labāks". Neskatoties uz tā salīdzinoši nelielo augumu, šis modelis konsekventi pārspēj vai neatpaliek no konkurentiem, kas ir četras reizes lielāki, veicot uzņēmumam specifiskus uzdevumus. Tehnoloģiju arhitektūras pasaulē tas ir ekvivalents veiklam sporta auto, kas uz līkumota ceļa apsteidz kravas automašīnu. Tas apstrīd fundamentālo pieņēmumu, ka mums ir nepieciešama masīva infrastruktūra, lai risinātu ikdienas biznesa problēmas.
Lai saprastu, kāpēc tas ir svarīgi, mums jāieskatās zem pārsega tam, kā tiek veidoti šie digitālie praktikanti. Pašreizējā MI uzplaukuma sākumā uzņēmumi savos apmācības algoritmos meta katru interneta drumslu. Rezultāts bija modeļi, kas bija neticami plaši, bet bieži vien sekli, ar tieksmi uz halucinācijām un — pats galvenais — pārmērīgi dārgi darbināšanai. Vidējam lietotājam tas nozīmēja, ka MI dzīvoja tikai mākonī, un to pārvaldīja tehnoloģiju giganti, kuriem piederēja masīvas serveru fermas, kas nepieciešamas to uzturēšanai.
IBM pieeja ar Granite 4.1 saimi pārstāv pagriezienu uz to, ko es saucu par "datu uzturvērtību". Tā vietā, lai barotu modeli ar visu haotisko atvērtā tīmekļa bufeti, IBM inženieri izveidoja augstas kvalitātes, pārbaudītu uzņēmuma datu diētu. Šis pilnveidotais apmācības komplekts ļauj 8B modelim attīstīt dziļāku izpratni par loģiku, kodu un profesionālo valodu bez triljoniem parametru "uzpūšanās", kas galvenokārt kalpo nieku atcerēšanai vai sociālo mediju slenga atdarināšanai. Raugoties uz kopējo ainu, mēs redzam pāreju no vispārējas nozīmes milžiem uz mērķim atbilstošiem speciālistiem.
Ja strādājat korporatīvajā vidē, jūs droši vien esat dzirdējuši runas par "Suverēno MI" vai datu privātumu. No patērētāja viedokļa masīvu modeļu problēma ir tāda, ka tie ir decentralizēti un nepārredzami. Jūs nosūtāt savus datus uz serveri, cerat, ka tie ir drošībā, un gaidāt atbildi. Tā kā Granite 4.1 ir atvērtā koda (konkrēti saskaņā ar Apache 2.0 licenci) un pietiekami mazs, lai darbotos uz pieticīgas aparatūras, uzņēmumi faktiski var pārvaldīt savu MI paši.
Praktiski runājot, 8B modelis var ietilpt augstas klases klēpjdatorā vai vienā vietējā serverī. Šī ir graujoša pārmaiņa tādām nozarēm kā veselības aprūpe vai finanses, kur sensitīvu klientu datu sūtīšana uz trešās puses mākoni ir regulatīvs murgs. Padarot modeli mazāku, IBM ir padarījis MI portatīvu. Tas vairs nav tāls orākuls; tas ir rīks, kas var dzīvot jūsu uzņēmuma ugunsmūra iekšienē, darbojoties ar tādu pārredzamības līmeni, kādu lielāki, patentēti modeļi vienkārši nevar sasniegt.
Viena no sistēmiskākajām problēmām mūsdienu tehnoloģijās ir "secinājumu nodoklis" (inference tax). Katru reizi, kad uzdodat MI jautājumu, tas patērē elektrību un skaitļošanas jaudu. Modelim ar 30 miljardiem vai 70 miljardiem parametru šīs izmaksas ir ievērojamas, ja tās tiek mērogotas tūkstošiem darbinieku. Zem pārsega Granite 4.1 8B modelis izmanto racionalizētu arhitektūru, kas samazina aprēķinu skaitu, kas nepieciešams katram ģenerētajam vārdam.
| Funkcija | IBM Granite 4.1 (8B) | Tipisks vidēja izmēra modelis (30B+) |
|---|---|---|
| Atmiņas nospiedums | ~5GB - 16GB (kvantēts) | 40GB - 80GB+ |
| Aparatūras prasības | Standarta patērētāju GPU / Mac M-sērija | Augstas klases uzņēmumu A100/H100 |
| Secinājumu izmaksas | Ārkārtīgi zemas | Vidējas līdz augstas |
| Galvenais lietošanas veids | Ierīcē, Edge, kodēšana, RAG | Vispārēja izpēte, smaga spriešana |
| Licencēšana | Atvērta (Apache 2.0) | Bieži ierobežota / patentēta |
Citiem vārdiem sakot, ja masīvie LLM ir mūsu laikmeta digitālā jēlnafta — vērtīga, bet grūti attīrāma un transportējama —, tad tādi modeļi kā Granite 4.1 ir augstas efektivitātes elektromotori. Tie paņem to pašu fundamentālo "enerģiju" un pārvērš to noderīgā darbā ar daudz mazākiem zudumiem. Uzņēmumam tas nozīmē zemākas abonēšanas maksas un ātrāku reakcijas laiku galalietotājam.
Jūs varētu jautāt, kāpēc konkrēta IBM modeļa izlaišana ir svarīga jums, ja neesat programmatūras inženieris vai tehnoloģiju direktors. Interesanti, ka šo mazāko, robusto modeļu ietekme, visticamāk, būs visvairāk jūtama sīkrīkos, kurus lietojat ikdienā. Tā kā MI kļūst arvien ciešāk saistīts ar mūsu personīgo dzīvi, mēs sasniedzam robežas tam, ko var apstrādāt mākoņdatošana. Latentums — nelielā aizkave starp jautājuma uzdošanu un atbildes saņemšanu — ir nemanāmas lietotāja pieredzes ienaidnieks.
Kad modeļi kļūst tik efektīvi, tie sāk parādīties jūsu vietējās lietojumprogrammās. Iedomājieties Excel versiju, kas ne tikai iesaka formulas, bet saprot visa jūsu uzņēmuma grāmatvedības loģiku, nekad neaugšupielādējot jūsu izklājlapu mākonī. Vai video redaktoru, kas var transkribēt un atzīmēt kadrus lokāli jūsu klēpjdatorā, kamēr atrodaties lidmašīnā bez Wi-Fi. Tas nav tikai par IBM; tas ir par plašāku nozares apziņu, ka MI nākotne ir decentralizēta. Šo mazo modeļu elastīgā daba nozīmē, ka pat tad, ja "lielie" MI pakalpojumu sniedzēji pārtrauc darbību vai maina cenas, uz Granite 4.1 bāzētie rīki turpinās darboties.
Protams, pastāv kompromiss. Lai gan Granite 4.1 8B kodēšanā un loģiskajā spriešanā startē virs savas svara kategorijas, tas neuzrakstīs dzejisku 500 lappušu romānu un neatrisinās teorētiskās fizikas dziļākos noslēpumus tikpat labi kā modelis ar triljonu parametru. Ir taustāma robeža tam, ko var uzglabāt astoņi miljardi savienojumu. Tomēr 90% gadījumu, kuros mēs faktiski izmantojam MI — e-pastu apkopošanai, kļūdu labošanai kodā vai datu ieguvei no PDF failiem —, papildu 62 miljardi parametru lielākā modelī būtībā ir liekais svars.
Mēs pašlaik atrodamies nestabilā MI attīstības periodā, kur "spīdīgo objektu" sindroms izgaist. Uzņēmumi sāk jautāt par galarezultātu: vai tas darbojas, vai tas ir drošs un vai mēs varam atļauties to darbināt? IBM liek likmes uz to, ka atbilde slēpjas precizitātē, nevis jaudā. Vēsturiski tehnoloģiju cikli vienmēr seko šim ceļam. Mēs sākam ar telpas izmēra lieldatoru (masīvo LLM) un galu galā izdomājam, kā to pašu jaudu ielikt personālajā datorā (mazais, efektīvais modelis).
Aiz žargona par "parametriem" un "svariem" slēpjas ļoti cilvēcisks stāsts par optimizāciju. Ikdienā mēs neizmantojam veseri, lai piekārtu gleznas rāmi. Mēs izmantojam darbam piemērotu rīku. Pēdējos trīs gadus MI nozare ir mēģinājusi mūs pārliecināt, ka mums visam ir vajadzīgs veseris.
Granite 4.1 pārstāv specializētā rīku komplekta ierašanos. Tas ir fundamentāls tehnoloģijas gabals, kas darbojas kā nenogurdināms praktikants, veicot atkārtotus, loģiski ietilpīgus uzdevumus, kas aizsprosto mūsu darba dienas. Koncentrējoties uz pārredzamību un efektivitāti, IBM izved MI no zinātniskās fantastikas jomas un ieved industriālās lietderības jomā. Tas ir solis, kas padara tehnoloģiju intuitīvāku un pieejamāku ikdienas lietotājam, pat ja šis lietotājs nekad neredz kodu, kas darbojas apakšā.
Galu galā Granite 4.1 panākumi liecina, ka MI revolūcija ieiet tās "praktiskajā" fāzē. Mēs virzāmies tālāk par apbrīnojamām demonstrācijām un ieejam uzticamas, vietējas un pieejamas digitālās palīdzības laikmetā. Rezultātā nākamreiz, kad dzirdēsiet uzņēmumu lielāmies ar sava jaunā MI modeļa milzīgo izmēru, jums droši vien vajadzētu pajautāt: "Bet vai tas var izdarīt vairāk ar mazāk?" Jo, kā parādīja IBM, visgraujošākā inovācija ne vienmēr ir tā, kas aizņem visvairāk vietas; tā ir tā, kas lieliski iekļaujas telpā, kura jums jau ir.
Tā vietā, lai gaidītu, kad no serveru fermas tuksnesī parādīsies viens, dievam līdzīgs intelekts, paskatieties uz mazajiem, izturīgajiem modeļiem, kas darbojas aparatūrā tieši jūsu priekšā. Vērojiet, kā mainās jūsu digitālie ieradumi, kad MI vairs nav lēns, dārgs viesis no mākoņa, bet gan ātra, privāta un integrēta jūsu vietējās darba plūsmas sastāvdaļa. Intelekta nākotne nav tikai liela; tā ir gudri maza.
Avoti:



Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.
/ Izveidot bezmaksas kontu