Mākslīgais intelekts

Kāpēc jūsu labākās AI atbildes varētu sniegt lētu modeļu grupa, nevis viens ģēnijs

OpenRouter Fusion API izmanto lētus AI modeļus, lai sasniegtu Claude Fable 5 jaudu par pusi cenas, parādoties tieši tad, kad Anthropic labākajam modelim tiek piemēroti eksporta aizliegumi.
Kāpēc jūsu labākās AI atbildes varētu sniegt lētu modeļu grupa, nevis viens ģēnijs

Lielākā daļa cilvēku uzskata, ka viedākais mākslīgais intelekts uz planētas ir tas, kuram ir lielākā serveru ferma un dārgākā abonēšanas maksa. Kamēr tādi giganti kā Anthropic un OpenAI sacenšas, lai izveidotu nākamo masīvo modeli, nozares perifērijā parādās cita stratēģija. Tā vietā, lai paļautos uz vienām milzīgām smadzenēm, uzņēmumi sāk izmantot mazāku, lētāku modeļu paneļus, lai pārspētu smagsvarus.

OpenRouter 12. jūnijā palaida API ar nosaukumu Fusion, kas pārbauda šo teoriju. Tas parādās brīdī, kad AI tirgū valda pēkšņs deficīts. Tieši tad, kad Anthropic izlaida savu augstākās klases Fable 5 modeli, ASV eksporta kontroles direktīva piespieda uzņēmumu pārtraukt tā darbību ārvalstu pilsoņiem visā pasaulē. Šo soli izraisīja apstrīdēts atklājums par "jailbreak" ievainojamību. OpenRouter aizpildīja šo tukšumu ar tiešu solījumu nodrošināt Fable līmeņa inteliģenci par pusi cenas.

Kā pūļa gudrība darbojas "zem pārsega"

Tradicionālais AI izmantošanas veids ir līdzīgs piezvanīšanai vienam konsultantam. Jūs uzdodat jautājumu, un šis viens modelis sniedz jums savu labāko minējumu, pamatojoties uz tā apmācību. Ja tas halucinē vai palaiž garām kādu detaļu, jums nav otra viedokļa. Fusion maina darba plūsmu uz kaut ko līdzīgāku korporatīvai valdes sēdei.

Kad lietotājs nosūta uzvedni, sistēma to vienlaikus nosūta vairākiem dažādiem AI modeļiem. Šie modeļi strādā paralēli, izmantojot tīmekļa meklēšanu un programmatūras rīkus, lai atrastu faktus. Kad tie pabeidz darbu, tiesneša modelis pārbauda visas atbildes, lai noskaidrotu, kur tās sakrīt un kur tās viena otrai pretrunā. Visbeidzot, sintezators — kas pēc noklusējuma ir Claude Opus 4.8 — apkopo visas šīs piezīmes un uzraksta vienu, saskaņotu atbildi.

Šāda pieeja uztver AI kā nenogurdināmu praktikantu, kurš vislabāk strādā tad, ja viņu pārbauda kolēģi. Lielākā daļa veiktspējas ieguvumu rodas tieši šajā pēdējā sintezēšanas posmā. Atsevišķs modelis, kas izskata vairākas perspektīvas, samazina iespēju, ka galīgajā izvadē iekļūst viens neobjektīvs viedoklis vai kļūda. Vidusmēra lietotājam tas nozīmē, ka atbilde ir balstīta uz konsensu, nevis uz viena konkrēta algoritma dīvainībām.

Matemātika aiz lētākām smadzenēm

Nozare mēra veiktspēju, izmantojot etalonus (benchmarks), un Fusion rezultāti ir nozīmīgi. DRACO etalonā, kurā tiek izmantoti sarežģīti pētniecības pieprasījumi no reāliem lietotājiem, budžeta AI modeļu panelis gandrīz sasniedza tirgus labāko solo izpildītāju rezultātus.

OpenRouter apvienoja Google Gemini 3 Flash ar diviem ķīniešu modeļiem — Kimi K2.6 un DeepSeek V4 Pro. Paši par sevi šie modeļi ir salīdzinoši lēti un tiem bieži trūkst tāda dziļuma kā premium modelim, piemēram, GPT-5.5. Tomēr, kad tos apvieno un sintezē Claude Opus, šis budžeta trio etalonā ieguva 64,7%.

Modeļa konfigurācija DRACO etalona rādītājs Relatīvās izmaksas
Fable 5 + GPT-5.5 (Opus sintezēts) 69,0% Augstas
Solo Claude Fable 5 65,3% Augstas
Fusion budžeta panelis (Gemini/Kimi/DeepSeek + Opus) 64,7% Zemas (aptuveni 50%)
Solo GPT-5.5 60,0% Augstas
Solo Claude Opus 4.8 58,8% Augstas

Budžeta panelis pārspēja GPT-5.5 un Opus 4.8 solo versijas. Tas ierindojās viena procentpunkta attālumā no Fable 5, vienlaikus maksājot aptuveni uz pusi mazāk par tūkstoti teksta vārdu. Tas liecina, ka vispārējai pētniecībai "viss vienā" dārgo modeļu ēra ir beigusies.

Navigācija eksporta kontroles plaisā

Šī izlaiduma laiks izceļ pārmaiņas AI regulēšanā. Anthropic lēmums apturēt Fable 5 un Mythos 5 pieejamību ārvalstu lietotājiem bija reakcija uz valdības direktīvām attiecībā uz drošības riskiem. Izstrādātājiem ārpus ASV tas radīja tūlītēju problēmu, jo viņu lietotnes pārstāja darboties vienas nakts laikā.

Fusion piedāvā veidu, kā saglabāt augstu veiktspēju, nebūtu piesaistītam vienam, politiski nepastāvīgam pakalpojumu sniedzējam. Tā kā API izmanto modeļu kopumu, tostarp atvērtā svara (open-weight) iespējas no dažādām valstīm, tas ir izturīgāks pret pēkšņām atslēgšanām. Ja viens modelis kļūst nepieejams, paneli var pārkonfigurēt ar citu ekspertu, lai aizpildītu plaisu. Šāda uzstādīšana nodrošina praktisku risinājumu lietotājiem, kuriem nepieciešama augsta līmeņa spriešana, bet kuri vairs nevar tieši piekļūt ASV premium modeļiem.

Turpretī skeptiķi norāda, ka tas neatrisina pamatā esošo eksporta problēmu. Fusion joprojām darbojas ar modeļiem, kas tiek novirzīti caur OpenRouter infrastruktūru, kura galu galā var saskarties ar saviem regulējošiem šķēršļiem. Pašlaik tas ir veids, kā apiet nozares elitārāko rīku augstās izmaksas un zemo pieejamību.

Kur grupas pieeja ir nepilnīga

Neraugoties uz iespaidīgajiem etalona skaitļiem, Fusion nav ideāls aizstājējs augstākā līmeņa modelim katrā scenārijā. DRACO testi koncentrējas uz pētniecību un plānošanu, kur vairākas perspektīvas ir priekšrocība. Ja runa ir par ilgtermiņa darbu vai padziļinātu programmēšanu, viens, augsti specializēts modelis joprojām saglabā vadību.

Sākotnējās lietotāju atsauksmes liecina, ka Fusion var rasties grūtības ar sarežģītu rīku izsaukšanu un programmatūras izstrādi. Šādos gadījumos vairāku dažādu modeļu koordinēšanas pieskaitāmās izmaksas var izraisīt neskaidrības. Fusion labāk darbojas kā rīks, ko galvenais modelis izmanto, kad tam nepieciešama padziļināta izpēte, nevis kā pilnīgs programmēšanas aģenta aizstājējs.

Tāpat pastāv caurskatāmības jautājums. Tā kā Fable 5 pašlaik ir ierobežots, neatkarīgiem pētniekiem ir grūti pārbaudīt šos salīdzinājumus reāllaikā. Skeptiķi, piemēram, tie, kas piedalījās palaišanas diskusijā vietnē X, ir atzīmējuši, ka etalonus var "apmānīt", ja modeļi tīmekļa meklēšanas laikā nejauši atrod vērtēšanas kritērijus. Lai gan OpenRouter apgalvo, ka ir filtrējis šos rezultātus, AI nozares nepārredzamais raksturs neļauj būt pilnīgi drošam par katru rezultātu.

Ko tas nozīmē jūsu digitālajam budžetam

Vidusmēra lietotājam šī maiņa signalizē par augstākās klases inteliģences demokratizāciju. Jums vairs nav jāmaksā 30 dolāri mēnesī vienam pakalpojumu sniedzējam, lai saņemtu labākās atbildes. Izstrādātāji tagad var izveidot lietotnes, kas nodrošina premium līmeņa spriešanu, izmantojot bezmaksas vai zemu izmaksu aizmugursistēmu (backends) kopumu.

Praktiski runājot, tas nozīmē, ka viedo asistentu, pētniecības rīku un datu analīzes programmatūras izmaksām vajadzētu sākt kristies. Ja lētu modeļu panelis var atbilst titāna veiktspējai, premium laboratorijas galu galā zaudēs savu cenu noteikšanas varu. Lietotājiem būtu jāmeklē rīki, kas ļauj pārslēgt modeļus vai veikt hibrīdo apstrādi, jo tie tuvākajos mēnešos, visticamāk, piedāvās vislabāko cenas un vērtības attiecību.

Galu galā domājiet par AI kā par modulāru sistēmu, kurā dažādas smadzenes apstrādā dažādas uzdevuma daļas. Fable 5 pazušana ir atgādinājums, ka paļaušanās uz vienu avotu ir riskanta. Fusion pierāda, ka labi organizēts modeļu pūlis var būt tikpat gudrs kā ierobežots ģēnijs.

Avoti:
OpenRouter Official Launch Documentation, June 2026.
Perplexity DRACO Benchmark Results Report, 2026.
Anthropic Export Control Compliance Statement, June 2026.
Sentiment Analysis and Technical Reviews via X and AI Research Communities.

bg
bg
bg

Uz tikšanos otrā pusē.

Mūsu end-to-end šifrētais e-pasta un mākoņdatu glabāšanas risinājums nodrošina visefektīvākos līdzekļus drošai datu apmaiņai, garantējot jūsu datu drošību un konfidencialitāti.

/ Izveidot bezmaksas kontu