Pirmadienį, 2026 m. vasario 16 d., „Alibaba Cloud“ pakeitė pasaulinių DI lenktynių peizažą pristatydama „Qwen3.5“. Ši naujausia jų patentuoto didžiojo kalbos modelio (LLM) versija nėra tik eilinis atnaujinimas; tai esminis posūkis link „agentinio DI eros“. Nors ankstesni modeliai daugiausia dėmesio skyrė tekstui ir kodui generuoti, „Qwen3.5“ yra sukurtas veikti – planuoti, vykdyti ir tobulinti sudėtingas darbo eigas su tokiu autonomijos lygiu, kuris, „Alibaba“ teigimu, lenkia pagrindinius JAV konkurentus.
Pranešimas pasirodė tuo metu, kai pramonė tolsta nuo paprastų pokalbių robotų ir juda link „agentų“ – DI sistemų, galinčių naudoti įrankius, naršyti programinės įrangos sąsajose ir užbaigti daugiapakopius projektus be nuolatinio žmogaus įsikišimo. Optimizuodama tiek mąstymo gylį, tiek veiklos sąnaudas, „Alibaba“ pozicionuoja „Qwen3.5“ kaip naujos kartos automatizuotų verslo sprendimų pagrindą.
Norėdami suprasti, kodėl „Qwen3.5“ yra svarbus, pirmiausia turime apibrėžti „agentinį“ posūkį. Tradiciniai DI modeliai yra reaktyvūs; jie pateikia atsakymą pagal užklausą. Tačiau agentinis DI yra proaktyvus. Jei paprašysite agento „suorganizuoti verslo kelionę“, jis ne tik išvardins skrydžius; jis patikrins jūsų kalendorių, palygins kainas įvairiose platformose, užsakys bilietą per API ir įtrauks maršrutą į jūsų tvarkaraštį.
Šiame leidime „Alibaba“ daug dėmesio skyrė „įrankių naudojimui“ ir „ilgalaikiam planavimui“. „Qwen3.5“ pasižymi ištobulinta architektūra, kuri leidžia išlaikyti nuoseklią loginę grandinę per tūkstančius žingsnių. Tai didelis šuolis nuo „haliucinacijų“ problemų, kurios kamavo ankstesnius modelius vykdant ilgalaikes užduotis. Vertindama modelį kaip išorinės programinės įrangos valdiklį, „Alibaba“ perkelia DI iš ekrano į tikrąją vartotojo darbo eigą.
„Alibaba“ vidiniai duomenys rodo, kad „Qwen3.5-Max“ (flagmano variantas) aplenkė kelis pirmaujančius Vakarų modelius pagrindiniuose mąstymo testuose. Konkrečiai, „HumanEval“ kodavimo teste ir „GSM8K“ matematinio mąstymo rinkinyje „Qwen3.5“ parodė 15 % pagerėjimą, palyginti su savo pirmtaku „Qwen2.5“, ir aplenkė dabartines konkurentų modelių versijas loginio mąstymo be išankstinio apmokymo (angl. zero-shot) srityje.
| Rodiklis | Qwen3.5-Max | Pirmaujantis JAV konkurentas (apytikslis) | Qwen2.5 (ankstesnis) |
|---|---|---|---|
| MMLU (bendrosios žinios) | 89.4% | 88.2% | 85.1% |
| HumanEval (kodavimas) | 91.2% | 89.5% | 82.4% |
| GSM8K (matematika) | 94.1% | 93.0% | 88.9% |
| Konteksto langas | 1M žetonų | 128k - 1M žetonų | 128k žetonų |
| Kaina (už 1 mln. žetonų) | $0.15 | $0.50 - $2.00 | $0.25 |
Be grynų rezultatų, labiausiai stebinantis šio leidimo aspektas yra kaštų efektyvumas. „Alibaba“ pavyko sumažinti „Qwen3.5“ užklausų vykdymo kainą beveik 40 %, palyginti su ankstesniais aukščiausio lygio modeliais. Didelės apimties verslo DI pasaulyje, kur įmonės kasdien apdoroja milijardus žetonų, šis kainos kritimas yra galingas akstinas migracijai.
Kaip „Alibaba“ pasiekė šių rezultatų? Paslaptis slypi hibridiniame mokymo metode, kuris apjungia tradicinį prižiūrimą tikslinimą su nauju „mąstymo ir pastiprinamojo mokymosi“ (angl. Reasoning-Reinforcement Learning, RRL) ciklu. Šis procesas apdovanoja modelį ne tik už teisingą galutinį atsakymą, bet ir už žingsnių, kurių jis ėmėsi tam pasiekti, efektyvumą bei tikslumą.
Įsivaizduokite tai kaip šefo mokymą. Tradicinis modelis apdovanojamas už paruoštą patiekalą. „Qwen3.5“ buvo apdovanotas už tai, kaip jis sutvarkė virtuvę, kaip valdė peilį ir kaip reguliavo karštį, kai kas nors nepavykdavo. Šis „procesu pagrįstas“ mokymasis daro modelį žymiai patikimesnį, kai jis susiduria su netikėtomis klaidomis realioje aplinkoje, pavyzdžiui, neveikiančia API nuoroda ar pasikeitusiu duomenų formatu.
Verslui „Qwen3.5“ pasirodymas atveria duris, kurios anksčiau buvo uždarytos dėl kainos ar patikimumo problemų. Štai trys tiesioginiai panaudojimo atvejai:
Jei jūsų organizacija svarsto galimybę integruoti „Qwen3.5“ į savo technologijų paketą, atsižvelkite į šiuos žingsnius, kad užtikrintumėte sklandų perėjimą:
„Qwen3.5“ pasirodymas signalizuoja apie bręstančią DI rinką, kurioje dėmesys nukrypsta nuo „magijos“ prie „naudingumo“. Agresyvi „Alibaba“ kainodara ir susitelkimas į agentines galimybes daro didžiulį spaudimą kitiems pasauliniams žaidėjams mažinti įėjimo barjerus. Žengiant toliau į 2026-uosius, DI modelio sėkmė nebebus matuojama tuo, kaip gerai jis rašo eilėraščius, bet tuo, kokią dalį įmonės veiklos naštos jis gali patikimai prisiimti.



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą