Pirmdien, 2026. gada 16. februārī, Alibaba Cloud mainīja globālās MI sacensības ainavu, iepazīstinot ar Qwen3.5. Šī viņu patentētā lielā valodas modeļa (LLM) jaunākā iterācija nav tikai kārtējais pakāpeniskais atjauninājums; tas ir fundamentāls pagrieziens uz "aģentiskā MI ēru". Kamēr iepriekšējie modeļi koncentrējās uz teksta un koda ģenerēšanu, Qwen3.5 ir izstrādāts darbībai — plānošanai, izpildei un sarežģītu darbplūsmu uzlabošanai ar tādu autonomijas līmeni, kas, pēc Alibaba apgalvojumiem, pārspēj tā galvenos ASV konkurentus.
Paziņojums nāk laikā, kad nozare attālinās no vienkāršiem tērzēšanas robotiem un pievēršas "aģentiem" — MI sistēmām, kas spēj izmantot rīkus, orientēties programmatūras saskarnēs un pabeigt daudzpakāpju projektus bez pastāvīgas cilvēka iejaukšanās. Optimizējot gan spriešanas dziļumu, gan darbības izmaksas, Alibaba pozicionē Qwen3.5 kā nākamo automatizēto uzņēmumu risinājumu paaudzes mugurkaulu.
Lai saprastu, kāpēc Qwen3.5 ir nozīmīgs, vispirms ir jādefinē "aģentiskā" pāreja. Tradicionālie MI modeļi ir reaktīvi; tie sniedz atbildi, pamatojoties uz uzvedni. Turpretim aģentiskais MI ir proaktīvs. Ja lūdzat aģentam "noorganizēt darījuma braucienu", tas ne tikai uzskaita lidojumus; tas pārbauda jūsu kalendāru, salīdzina cenas dažādās platformās, rezervē biļeti, izmantojot API, un pievieno maršrutu jūsu grafikam.
Alibaba šajā laidienā ir lielu uzmanību pievērsusi "rīku izmantošanai" un "ilgtermiņa plānošanai". Qwen3.5 ir uzlabota arhitektūra, kas ļauj tam saglabāt saskaņotu loģisko ķēdi tūkstošiem soļu garumā. Tas ir būtisks lēciens no "halucināciju" problēmām, kas skāra agrākos modeļus, veicot ilgstošus uzdevumus. Uzskatot modeli par ārējās programmatūras kontrolieri, Alibaba pārvieto MI no ekrāna uz lietotāja faktisko darbplūsmu.
Alibaba iekšējie dati liecina, ka Qwen3.5-Max (vadošais variants) ir apsteidzis vairākus vadošos Rietumu modeļus galvenajos spriešanas testos. Konkrēti, HumanEval programmēšanas testā un GSM8K matemātiskās spriešanas komplektā Qwen3.5 uzrādīja par 15% labākus rezultātus nekā tā priekštecis Qwen2.5, un nedaudz apsteidza konkurentu modeļu pašreizējās iterācijas "zero-shot" loģiskajā spriešanā.
| Rādītājs | Qwen3.5-Max | Vadošais ASV konkurents (aplēse) | Qwen2.5 (Iepriekšējais) |
|---|---|---|---|
| MMLU (Vispārīgās zināšanas) | 89.4% | 88.2% | 85.1% |
| HumanEval (Programmēšana) | 91.2% | 89.5% | 82.4% |
| GSM8K (Matemātika) | 94.1% | 93.0% | 88.9% |
| Konteksta logs | 1M žetonu | 128k - 1M žetonu | 128k žetonu |
| Izmaksas (par 1M žetonu) | $0.15 | $0.50 - $2.00 | $0.25 |
Papildus neapstrādātajiem rezultātiem pārsteidzošākais laidiena aspekts ir izmaksu efektivitāte. Alibaba ir izdevies samazināt Qwen3.5 secināšanas (inference) izmaksas par gandrīz 40%, salīdzinot ar iepriekšējiem augstākā līmeņa modeļiem. Liela apjoma uzņēmumu MI pasaulē, kur uzņēmumi katru dienu apstrādā miljardiem žetonu, šis cenu kritums ir spēcīgs stimuls migrācijai.
Kā Alibaba sasniedza šos uzlabojumus? Noslēpums slēpjas hibrīdā apmācības pieejā, kas apvieno tradicionālo uzraudzīto precizēšanu (supervised fine-tuning) ar jaunu "Spriešanas-pastiprināšanas mācīšanās" (Reasoning-Reinforcement Learning jeb RRL) cilpu. Šis process apbalvo modeli ne tikai par pareizu galīgo atbildi, bet arī par to soļu efektivitāti un precizitāti, kas veikti, lai to sasniegtu.
Iedomājieties to kā pavāra apmācību. Tradicionālais modelis tiek apbalvots par gatavo ēdienu. Qwen3.5 tika apbalvots par to, kā tas organizēja virtuvi, kā rīkojās ar nazi un kā regulēja siltumu, kad kaut kas nogāja greizi. Šī "uz procesu balstītā" mācīšanās padara modeli ievērojami uzticamāku, saskaroties ar neparedzētām kļūdām reālajā vidē, piemēram, bojātu API saiti vai datu formāta izmaiņām.
Uzņēmumiem Qwen3.5 ierašanās paver durvis, kas iepriekš bija slēgtas izmaksu vai uzticamības apsvērumu dēļ. Šeit ir trīs tūlītēji lietošanas piemēri:
Ja jūsu organizācija apsver Qwen3.5 integrēšanu savā tehnoloģiju kopumā, apsveriet šādus soļus, lai nodrošinātu vienmērīgu pāreju:
Qwen3.5 palaišana signalizē par MI tirgus nobriešanu, kur fokuss pārvietojas no "maģijas" uz "lietderību". Alibaba agresīvā cenu politika un koncentrēšanās uz aģentiskajām iespējām rada milzīgu spiedienu uz citiem globālajiem spēlētājiem samazināt ienākšanas barjeras. Virzoties tālāk 2026. gadā, MI modeļa panākumi vairs netiks mērīti pēc tā, cik labi tas raksta dzejoli, bet gan pēc tā, cik lielu uzņēmuma operatīvo slodzi tas spēj uzticami nest.



Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.
/ Izveidot bezmaksas kontu