Tehnoloģiju nozare pēdējos divus gadus pavadīja pārliecībā, ka vienīgais veids, kā paātrināt mākslīgo intelektu (MI), ir no jauna izgudrot datoru mikroshēmu. Jaunuzņēmumi, piemēram, Groq un Cerebras, piesaistīja miljardiem dolāru, lai izveidotu masīvu, specializētu aparatūru, kas paredzēta datu sastrēgumu novēršanai, kuri palēnina tādus modeļus kā ChatGPT. Naratīvs bija vienkāršs: Nvidia standarta grafiskās mikroshēmas bija piemērotas MI apmācībai, taču tās bija pārāk lēnas sekundes daļas reakcijām, kas nepieciešamas reālajā pasaulē. Šī pārliecība pārvērsta pielāgotā silīcija meklējumus digitālā zelta drudzī.
Xiaomi tikko pierādīja, ka šī teorija ir nepareiza. Pirmdienas rītā Ķīnas elektronikas gigants izlaida jaunu apkalpošanas režīmu savam flagmaņa modelim MiMo-V2.5-Pro-UltraSpeed. Tas paveica ko vairāk nekā tikai ātruma rekorda labošanu. Tas sagrāva griestus tam, ko mēs uzskatījām par iespējamu uz standarta, plaši pieejamas aparatūras. Sistēma sasniedza ātrumu 1200 marķieri (tokens) sekundē triljona parametru modelim. Kontekstam — marķieris ir aptuveni trīs ceturtdaļas no vārda. Tas nozīmē, ka modelis ģenerē aptuveni 900 vārdus katru sekundi.
Raugoties uz kopējo ainu, tas ir 15 reizes ātrāk nekā GPT un Claude versijas, kuras lielākā daļa cilvēku izmanto šodien. Xiaomi to paveica, izmantojot standarta 8-GPU mezglu — tādu pašu aparatūru, kādu var iznomāt no jebkura liela mākoņpakalpojumu sniedzēja. Šī attīstība liecina, ka nākamās paaudzes MI ātruma noslēpums nav labāka mikroshēmu rūpnīca. Tas ir gudrāks veids, kā izmantot mikroshēmas, kas mums jau ir.
Lai saprastu, kāpēc tas ir svarīgi, mums jāskatās uz to, kā cilvēki uztver MI ātrumu. Kad uzdodat jautājumu ChatGPT vai Claude, teksts parasti parādās ātra mašīnrakstītāja tempā. Tas ir aptuveni 60 līdz 80 marķieri sekundē. Lai gan cilvēkam, kas lasa vienu atbildi, tas šķiet ātri, tas ir pārāk lēni sarežģītiem industriāliem uzdevumiem. Ātrgaitas MI ir neredzamais mugurkauls tādām lietām kā reāllaika tulkošana, tūlītēja krāpšanas noteikšana banku darbībā un autonomi aģenti, kuriem minūtē jāpieņem tūkstošiem lēmumu.
Vēsturiski lielākais ātrums tika sasniegts ar pielāgotu aparatūru. Cerebras nonāca ziņu virsrakstos, sasniedzot gandrīz 1000 marķierus sekundē Meta modelim, taču tam bija nepieciešama mikroshēma pusdienu šķīvja izmērā. Xiaomi sasniedza šo pašu slieksni — un pēc tam to pārsniedza — ar modeli, kas ir vairāk nekā divas reizes lielāks.
| Modelis | Marķieri sekundē | Aparatūras veids |
|---|---|---|
| MiMo-V2.5-Pro-UltraSpeed | 1 200 | Standarta GPU |
| Gemini Flash | 192 | Google TPU (Pielāgots) |
| Claude Haiku | 98 | Standarta mākoņa GPU |
| Claude Opus 4.6 | 71 | Standarta mākoņa GPU |
| GPT-5.5 | 68 | Standarta mākoņa GPU |
Zem pārsega Xiaomi izmantoja tehniku, ko sauc par FP4 kvantēšanu (quantization) modeļa ekspertu slāņos. Lai to paskaidrotu vienkāršos vārdos, iedomājieties, ka modelis ar triljonu parametru ir milzīga bibliotēka. Parasti datoram ir jāizlasa katrs vārds katrā grāmatā, lai sniegtu jums atbildi. Tas prasa daudz atmiņas un laika. Kvantēšana ir veids, kā samazināt šīs grāmatas, lai tās aizņemtu mazāk vietas.
Daudzi uzņēmumi mēģina samazināt visu bibliotēku, taču tas bieži padara MI mazāk inteliģentu un vairāk pakļautu kļūdām. Xiaomi rīkojās ķirurģiski. Viņi saglabāja modeļa pamatloģiku augstā izšķirtspējā, bet saspieda specializētos ekspertu slāņus — specifiskas bibliotēkas nodaļas — līdz 4 bitu precizitātei. Tas uz pusi samazināja datu apjomu, kas mikroshēmai bija jāpārvieto. Rezultāts ir modelis, kas saglabā savu augsto IQ, vienlaikus pārvietojoties divreiz ātrāk caur datora atmiņu.
Ir arī otrs triks, ko sauc par DFlash spekulatīvo dekodēšanu. Tipiskā MI sarunā modelis ir kā rakstnieks, kuram pirms rakstīšanas jāpārdomā katrs burts. Spekulatīvā dekodēšana ievieš nenogurdināmu praktikantu, kurš mēģina uzminēt nākamos dažus vārdus. Ja praktikantam ir taisnība, modelis pieņem visu teksta bloku uzreiz. Ja praktikants kļūdās, modelis to izlabo. Xiaomi DFlash ir tik efektīvs, ka tas piedāvā astoņus marķierus vienlaikus un parasti sešus no tiem uzmin pareizi. Tas ļauj modelim virzīties uz priekšu lielos lēcienos, nevis rāpot pa vienam vārdam.
Programmatūras efektivitāte bieži vien ir saistīta ar tukšo vietu likvidēšanu procesā. Xiaomi savienoja savu modeli ar jaunu secināšanas dzinēju (inference engine) ar nosaukumu TileRT. Lielākajā daļā MI sistēmu ir neliela aizkave katru reizi, kad programmatūra liek aparatūrai veikt jaunu aprēķinu. Šīs plaisas mēra mikrosekundēs, taču tās uzkrājas, kad veicat miljardiem aprēķinu.
TileRT visu skaitļošanas procesu visu laiku uztur GPU atmiņā. Tas novērš tradicionālās MI apstrādes "start-stop" raksturu. Šī racionalizētā pieeja nodrošina, ka grafiskās mikroshēmas nekad nestāv dīkstāvē, gaidot nākamo instrukciju. Šī saspiesto datu, veiksmīgo minējumu un bezplaisas konveijera kombinācija ir tā, kas ļauj standarta serverim darboties kā vairāku miljonu dolāru vērtam pielāgotam superdatoram.
Vidējam lietotājam šie ātruma rekordi var šķist kā abstrakta korporatīvā konkurence. Tomēr ietekme uz patērētāju tehnoloģijām ir taustāma. Kad MI ir tik ātrs, tas no tērzēšanas robota, ar kuru sarunājaties, pārvēršas par rīku, kas darbojas jūsu labā fonā.
Apsveriet reāllaika valodas tulkošanas lietotni. Pašreizējam ātrumam bieži ir manāma aizkave, kas apgrūtina dabisku sarunu. Ar 1000 marķieriem sekundē MI varētu noklausīties pilnu teikumu, iztulkot to trīs dažādās valodās un pārbaudīt visu trīs gramatiku īsākā laikā, nekā nepieciešams, lai jūs pamirkšķinātu acis. Tas novērš neērtās pauzes starptautiskās biznesa sanāksmēs vai ceļojumos.
No tirgus viedokļa tas ir graujošs solis MI izmaksu ziņā. Xiaomi nosaka šim UltraSpeed izmēģinājumam trīsreiz augstāku cenu nekā standarta tarifam, taču viņi nodrošina desmitreiz lielāku jaudu. Izstrādātājiem, kuri veido jaunas lietotnes, tas nozīmē, ka viņi var paveikt daudz vairāk darba par katru dolāru, ko tērē mākoņskaitļošanai. Zemākas izmaksas izstrādātājiem parasti nozīmē lētākas vai spējīgākas lietotnes galalietotājam.
Xiaomi panākumi liecina, ka pēdējo gadu aparatūras trūkums varētu būt bijusi programmatūras problēma maskētā veidā. Uzņēmumiem saprotot, ka tie var sasniegt milzīgu veiktspējas pieaugumu, izmantojot labāku kodēšanu, spiediens iegādāties visdārgākās, specializētās mikroshēmas var sākt mazināties. Mēs virzāmies uz periodu, kurā matemātikas efektivitāte ir tikpat svarīga kā silīcija jauda.
Jums vajadzētu sagaidīt, ka līdz šī gada beigām jūsu ierīcēs parādīsies reāllaika MI funkciju vilnis. Tie nebūs tikai ātrāki tērzēšanas roboti. Meklējiet funkcijas, kurām nepieciešams, lai MI vienlaikus pārdomātu desmitiem iespēju, piemēram, progresīvus kodēšanas asistentus, kas dažu sekunžu laikā uzraksta veselas programmas, vai spēļu varoņus, kuriem ir neplānotas, tūlītējas sarunas. Šķērslis vairs nav tas, cik ātri dators spēj domāt. Tas ir tas, cik ātri mēs varam tam dot kaut ko noderīgu, ko darīt.
Avoti:
Xiaomi MiMo Developer Documentation (April 2026)
Artificial Analysis LLM Leaderboard (June 2026)
TileRT Technical Whitepaper (May 2026)
Cerebras and Groq Performance Benchmarks (2025)



Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.
/ Izveidot bezmaksas kontu