Dirbtinis intelektas

Pamirškite ažiotažą — „Claude Opus 4.7“ ištaiso DI problemas, bet tuština jūsų biudžetą

„Anthropic“ sukurtas „Claude Opus 4.7“ pirmauja programavimo ir loginio mąstymo testuose, tačiau gerokai padidina žetonų sąnaudas. Sužinokite apie poveikį programuotojams, biudžetams ir kasdieniam DI naudojimui šioje analizėje.
Pamirškite ažiotažą — „Claude Opus 4.7“ ištaiso DI problemas, bet tuština jūsų biudžetą

Tylus išleidimas programuotojų nusivylimo fone

Programuotojai niurnėjo ištisas savaites. „Claude Opus 4.6“, ankstesnis pagrindinis „Anthropic“ DI modelis, pradėjo veikti lėtai. „GitHub“ gijos, „Reddit“ įrašai ir skundai „X“ platformoje pildėsi istorijomis apie „DI šrinkfliaciją“ — tą įkyrų pojūtį, kad modelis, už kurį jie sumokėjo, paslapčia veikia prasčiau. „Anthropic“ neigė keitusi svorius siekdama sutaupyti skaičiavimo resursų, tačiau skepticizmas išliko. Galiausiai, 2026 m. balandžio 16 d., jie išleido „Claude Opus 4.7“. Tai galingiausias jų „Opus“ modelis iki šiol, jau prieinamas visiems, o pirmieji testai patvirtina, kad jis susigrąžina pranašumą, kurio vartotojai pasigedo.

Paprastai tariant, tai nėra visiškas atnaujinimas. Tai tikslinis patobulinimas, tiesiogiai sprendžiantis nusiskundimus. Vartotojai gali patikėti sunkias programavimo užduotis — pavyzdžiui, derinant didelę programą ar projektuojant naują funkciją — su mažesne priežiūra. Tačiau tai nėra stebuklinga kulka. Už techninio žargono slypintis „Opus 4.7“ spindi loginio mąstymo ir kodavimo testuose, tačiau ryja žetonus (angl. tokens) kaip nepavargstantis praktikantas, naikinantis jūsų užkandžių biudžetą.

Testų pergalės: protingesnis, bet kokia kaina?

„Anthropic“ pranešime pabrėžiama, kad „Opus 4.7“ pirmauja programavimo ir loginio mąstymo testų lentelėse. Nepriklausomi vertinimai tai patvirtina. Standartiniuose rodikliuose, tokiuose kaip „HumanEval“ kodo generavimui, jis lenkia pirmtakus ir konkurentus iš „OpenAI“ bei „Google“. Loginio mąstymo užduotys, kuriose DI turi nuosekliai jungti logines grandis, taip pat rodo akivaizdų progresą.

Štai trumpas pagrindinių lyginamųjų testų palyginimas (remiantis „Anthropic“ duomenimis ir trečiųjų šalių bandymais):

Testas Opus 4.6 Opus 4.7 Patobulinimas
HumanEval (Programavimas) 88% 92% +4%
GPQA (Loginis mąstymas) 52% 57% +5%
MATH (Matematinės problemos) 71% 75% +4%

Tai nėra revoliuciniai šuoliai, tačiau jie pakankamai solidūs realiam darbui. Vidutiniam vartotojui tai reiškia mažiau erzinančių ciklų, kai DI pateikia pusiau paruoštą kodą. Įsivaizduokite, kad prašote jo sukurti paprastą duomenų rinkiklį (angl. web scraper): „Opus 4.7“ ne tik parašo švaresnį „Python“ kodą, bet ir matomai paaiškina savo logiką, tarsi rodytų sprendimo eigą matematikos pamokoje.

Įdomu tai, kad šis skaidrumas atsiranda per garsiai rodomą minčių sekos (angl. chain-of-thought) loginį mąstymą. Matote, kaip modelis mąsto balsu — „Pirma, išanalizuoti HTML; toliau, ištraukti nuorodas; vengti dublikatų naudojant...“ — todėl rezultatai tampa patikimesni. Praktiškai tai primena jaunesnįjį programuotoją, pasakojantį apie savo procesą, o tai sumažina poreikį tikrinti kiekvieną eilutę.

Žetonų alkis: kodėl jūsų piniginė tai pajus

Galia turi savo kainą. „Opus 4.7“ yra žetonus ryjanti mašina. Žetonai yra DI pokalbių valiuta — kiekvienas žodis jūsų užklausoje ir atsakyme kainuoja. Remiantis vartotojų pranešimais „X“ ir programuotojų forumuose, šis modelis sunaudoja 20–30 % daugiau žetonų vienai sąveikai nei 4.6 versija. Kodėl? Ta matoma loginio mąstymo grandinė išpučia atsakymo ilgį.

Rinkos pusėje kainodara išlieka pagrįsta įvestimi/išvestimi: maždaug 15 USD už milijoną įvesties žetonų ir 75 USD už milijoną išvesties žetonų „Opus“ lygyje („Anthropic“ tarifai išleidimo metu). Viena sudėtinga programavimo sesija gali kainuoti 5–10 USD, palyginti su 3–7 USD anksčiau. Mėgėjams ar mažoms komandoms tai yra keičiamo dydžio išlaidos, kol pasiekiama riba — dirbant iteratyviai biudžetai išsenka greitai.

Kitaip tariant, galvokite apie žetonus kaip apie skaitmeninį kurą. „Opus 4.7“ variklis yra galingesnis, todėl jis sunaudoja daugiau degalų. Kasdieniai vartotojai, rašantys namų automatizavimo scenarijus ar analizuojantys skaičiuokles, to gali ir nepastebėti. Tačiau profesionalai, kuriantys programėles? Tikėkitės, kad sąskaitos augs, ypač jei negailestingai neoptimizuosite savo užklausų.

Ne „Mythos“: galia, kuria gundomi pažengę vartotojai

Žvelgiant plačiau, „Opus 4.7“ nėra tas žvėris, kurį „Anthropic“ rezervuoja elitiniams partneriams. Tai „Claude Mythos“ — kontroversiška jėgainė, siūloma pasirinktinai. Nutekėjimai ir gandai rodo, kad „Mythos“ triuškina viešus modelius visuose frontuose, tačiau reguliavimo kliūtys ir saugumo sumetimai laiko jį užrakintą. „Opus 4.7“ yra vartotojams pritaikyta versija — stipri, bet santūri.

Istoriškai tai atkartoja didžiųjų technologijų įmonių strategiją: viešai pateikti patobulinimus po truputį, o vertingiausius brangakmenius pasilikti sau. „Anthropic“ viešieji ryšiai tai pateikia kaip atsakingą mastelio didinimą. Čia esama šiek tiek skepticizmo — po 4.6 versijos bėdų tai atrodo kaip pleistras ant sisteminės neskaidrių modelio korekcijų problemos. Programuotojai „X“ platformoje juokauja, kad 4.7 versija turi „ankstyvosios 4.6 versijos aurą“, kol dar nebuvo atlikti tariami galios sumažinimai.

Vartotojo požiūriu, „Mythos“ jums dar netrūksta. Daugumai tai būtų perteklinė ir brangesnė priemonė. Tačiau tai pabrėžia besikeičiantį DI kraštovaizdį: viešieji įrankiai tobulėja, tačiau tikrieji lūžiai slepiasi už konfidencialumo sutarčių (NDA).

Realus poveikis: nuo kodo iki kasdienybės

Žvelgiant giliau, „Opus 4.7“ supaprastina darbo eigą. Prisimenu, kaip testavau panašius atnaujinimus savo technologijų analizės laikais — staiga tai, kas reikalavo valandų derinant užklausas, susitraukia iki minučių. Rinkodaros specialistas, rengiantis el. pašto kampanijas? Modelis intuityviai supranta auditorijos segmentavimą. Studentas, sprendžiantis fizikos uždavinius? Nuoseklūs paaiškinimai padeda geriau suprasti temą.

Priešingai, žetonų šuolis smogė netolygiai. Labiausiai tai pajus laisvai samdomi darbuotojai su griežtomis maržomis — teks optimizuoti arba mokėti daugiau. Įmonės su API biudžetais? Poveikis nereikšmingas. Kasdieniame gyvenime, jei naudojate „Claude“ per programėles kaip „Poe“ arba tiesiogiai „Anthropic“ svetainėje, stebėkite naudojimą. Nemokami planai greitai išsenka; mokami planai prasideda nuo 20 USD per mėnesį, tačiau kaina auga intensyviai naudojant.

Ką tai reiškia jums: protingesni DI asistentai jau čia, demokratizuojantys profesionalaus lygio programavimą ir analizę. Tačiau traktuokite tai kaip aukščiausios kokybės įrankį — atitinkamai planuokite biudžetą. Nebėra begalinių pokalbių nežvilgtelint į „skaitiklį“.

DI šrinkfliacijos atgarsiai ir kas toliau

4.6 versijos neigiama reakcija nebuvo atsitiktinė. DI srityje tai cikliška: modeliai išleidžiami galingi, vėliau optimizuojami dėl efektyvumo, kartais kokybės sąskaita. Greitas „Anthropic“ atsakas — skubus atnaujinimas — rodo, kad jie klausosi. Visgi tyčinio galimybių mažinimo neigimas skatina nepasitikėjimą. Skaidrus pakeitimų žurnalas galėtų tai ištaisyti, bet nesitikėkite to greitai.

Žvelgiant į ateitį, pagal esamus dėsningumus iki vasaros tikėkitės „Opus 4.8“. Žetonų efektyvumas gali pagerėti atsiradus naujiems apmokymo būdams. Platesnis poveikis? Pigesnis ir protingesnis DI spaudžia konkurentus, potencialiai mažindamas kainas visoje pramonėje. Kol kas „Opus 4.7“ vėl pakelia kartelę.

Galiausiai, pakeiskite savo požiūrį: DI nėra nemokama magija. Tai atsparus įrankis, evoliucionuojantis tarp kompromisų. Kitą kartą, kai prašysite kodo, įvertinkite matomą intelektą — ir sutrumpinkite tas išsamias grandines, kad sutaupytumėte žetonų. Jūsų ištobulinti skaitmeniniai įpročiai atskleis visą jo potencialą.

bg
bg
bg

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą