Dirbtinis intelektas

Kodėl patys pajėgiausi DI agentai staiga tampa pigiausiais samdyti

„Anthropic“ pristatytas „Claude Sonnet 5“ žymi lūžį, kai agentinio DI našumas tampa pigesnis ir prieinamesnis kiekvienam programinės įrangos kūrėjui.
Kodėl patys pajėgiausi DI agentai staiga tampa pigiausiais samdyti

Metų metus technologijų pramonė laikėsi nuspėjamo kelio, kur patys pajėgiausi dirbtinio intelekto modeliai buvo pasiekiami tik už didžiausią kainą. Jei norėjote modelio, galinčio spręsti sudėtingas problemas, mokėjote priemoką už didžiausias, daugiausiai išteklių reikalaujančias versijas. „Anthropic“ dabar griauna šią trajektoriją išleisdama „Claude Sonnet 5“. Šis naujas modelis yra vidutinio dydžio įrankis, veikiantis tokiu lygiu, koks anksčiau buvo būdingas tik brangioms, aukščiausios klasės sistemoms. Tai rodo, kad intelekto kaina krenta net tada, kai jo naudingumas pasiekia naujas aukštumas.

„Anthropic“ apibūdina „Sonnet 5“ kaip agentinį modelį. Paprastais žodžiais tariant, tai reiškia, kad DI nebėra tik pokalbių partneris, atsakinėjantis į klausimus ar apibendrinantis el. laiškus. Jis veikia labiau kaip nepavargstantis praktikantas, turintis prieigą prie jūsų kompiuterio ekrano, naršyklės ir terminalo. Užuot tik pasakęs, kaip ištaisyti klaidą kode, agentinis modelis gali atidaryti failą, perrašyti eilutes ir pats paleisti testą. Praktiškai kalbant, mes judame iš pokalbių robotų eros į skaitmeninių darbininkų erą.

Perėjimas nuo pokalbio prie veiksmo

Žvelgiant į platesnį vaizdą, pramonė juda link standarto, kuriame agentinis pajėgumas yra bazinis reikalavimas. Prieš kelis mėnesius modeliui reikėjo būti masyviam ir brangiam, kad jis galėtų atlikti daugiapakopes užduotis be žmogaus pagalbos. „Sonnet 5“ keičia šią matematiką. Jis valdo įrankius ir savarankiškai kuria planus už dalį savo pirmtakų kainos. Ši tendencija matoma visame sektoriuje. „OpenAI“ neseniai pristatė „GPT-5.6 Sol“, leidžiantį vartotojams deleguoti darbą subagentams. „Google“ taip pat pozicionavo „Gemini 3.5 Flash“ kaip įrankį planavimui ir realaus darbo vykdymui, o ne tik susirašinėjimui.

Žvelgiant giliau, „Sonnet 5“ sukurtas susidoroti su netvarkinga programinės įrangos kūrimo ir administracinių užduočių realybe. Istoriškai DI modeliai dažnai sustodavo įpusėję sudėtingą darbą. Jei paprašytumėte senesnio modelio atnaujinti klientų duomenų bazę ir tada išsiųsti pranešimą konkrečiai komandai, jis galėtų atlikti pirmąją dalį ir laukti tolesnių nurodymų. „Anthropic“ teigia, kad „Sonnet 5“ yra kitoks. Jis užbaigia darbus nuo pradžios iki galo ir pats patikrina savo rezultatus, ieškodamas klaidų be papildomo raginimo. Šis autonomijos lygis daro jį praktišku pasirinkimu kasdienei automatizacijai verslo aplinkoje.

Skaitmeninio darbo kainos iššifravimas

Apčiuopiamiausias pokytis vidutiniam vartotojui yra kainodaros struktūra. DI pasaulyje išlaidas matuojame žetonais (tokens), kurie iš esmės yra maži teksto ar duomenų fragmentai. „Anthropic“ nustatė „Sonnet 5“ kainą – 2 USD už milijoną įvesties žetonų ir 10 USD už milijoną išvesties žetonų. Net kai rugsėjį šios kainos šiek tiek pakils, jos išliks mažesnės nei išlaidos, susijusios su „OpenAI“ „GPT-5.5“ ir „Google“ „Gemini 3.1 Pro“. Ši lentelė iliustruoja, kaip „Sonnet 5“ įsilieja į dabartinę rinką, lyginant su jo pirmtaku ir galingesniu „broliu“.

Modelis Įvesties kaina (už 1 mln. žetonų) Išvesties kaina (už 1 mln. žetonų) Programavimo našumas (lyginamasis balas)
Claude Sonnet 5 (Intro) $2.00 $10.00 63.2%
Claude Sonnet 4.6 $3.00 $15.00 58.1%
Claude Opus 4.8 High High 69.2%

„Sonnet 5“ užima unikalią poziciją. Jis pigesnis už senąjį vidutinės klasės modelį, tačiau veikia beveik taip pat gerai, kaip aukščiausios klasės „Opus 4.8“. Kai kuriose žiniomis grįstose užduotyse jis netgi lenkia didesnįjį modelį. Verslui, kuriam kas valandą reikia atlikti tūkstančius automatizuotų užduočių, šios santaupos greitai susidaro. Skiriamasis bruožas dabartinėje rinkoje nebėra tik tai, kas turi protingiausią modelį. Tikroji konkurencija dabar vyksta dėl to, kas gali pateikti patikimą, autonomišką darbą už mažiausią įmanomą kainą.

Kodėl saugumas svarbus autonominiams agentams

Kai suteikiate DI galią naudotis jūsų naršykle ar terminalu, rizika padidėja. Agentas, galintis naršyti internete, taip pat gali būti apgautas atlikti kenkėjiškus veiksmus arba nutekinti jautrius duomenis. „Anthropic“ tai sprendžia mokydama „Sonnet 5“ būti atsparesnį „prompt-injection“ atakoms. Tai technika, kai vartotojas arba kenkėjiškas kodas bando perimti modelio instrukcijas, kad priverstų jį elgtis nenumatytais būdais.

„Sonnet 5“ geriau atsisako nesaugių užklausų nei ankstesnis „Sonnet 4.6“. Jis taip pat pasižymi mažesniu „sikofantiško“ elgesio lygiu – tai DI modelių tendencija sutikti su viskuo, ką sako vartotojas, net jei vartotojas klysta ar apgaudinėja. Tačiau jis nėra toks tvirtas kaip aukščiausios klasės „Opus 4.8“, kai kalbama apie pažangaus kibernetinio saugumo piktnaudžiavimo prevenciją. „Anthropic“ atvirai pripažįsta, kad nors „Sonnet 5“ yra saugesnis bendram verslo naudojimui, didesni modeliai vis dar išlieka aukso standartu didelės rizikos aplinkose, kur saugumas yra prioritetas.

Praktinė reikšmė jūsų darbo eigai

Vartotojo požiūriu, „Sonnet 5“ pasirodymas reiškia, kad įrankiai, kuriais jau naudojatės, taps daug galingesni nebrangdami. Programinės įrangos įmonės, tokios kaip „Zapier“ ir „Lovable“, jau integruoja šiuos modelius sudėtingiems, daugiadaliams darbams atlikti. Jei naudojate CRM sistemą, pavyzdžiui, „Salesforce“, netrukus galite pamatyti DI, kuris ne tik siūlo atnaujinimus, bet ir juos atlieka, o tada automatiškai praneša jūsų pardavimų komandai. Tai sumažina mažų, pasikartojančių užduočių skaičių, kurios paprastai užgriozdina darbo dieną.

Iš esmės barjeras kurti galingas DI programėles mažėja. Maži startuoliai dabar gali pasiekti agentines galimybes, kurios prieš metus buvo prieinamos tik didelėms įmonėms. Tai sukuria decentralizuotą aplinką, kurioje specializuoti DI agentai gali būti sukurti labai specifinėms nišoms – nuo asmeninių tvarkaraščių valdymo iki sudėtingos logistikos automatizavimo sunkiojoje pramonėje. Šių modelių atsparumas baigiant užduotis be žmogaus priežiūros daro juos keičiamu sprendimu įmonėms, kurios jau dabar dirba su nedidelėmis komandomis.

Esminė išvada apie agentinį DI

„Sonnet 5“ išleidimas patvirtina, kad DI pramonė žengia į pragmatiškąją fazę. Fokusas nukrypsta nuo naujovės, kad kompiuteris gali kalbėti, link sistemos, kuri gali dirbti, naudingumo. Dėl to matome ciklišką tendenciją, kai pajėgumai didėja, o kaina mažėja. Tai įprastas dėsningumas brandžiuose technologijų sektoriuose, tačiau greitis, kuriuo tai vyksta DI srityje, yra beprecedentis.

Galų gale, savo skaitmeninėje ekosistemoje turėtumėte tikėtis pamatyti daugiau „vykdytojų“ ir mažiau „kalbėtojų“. Užuot teikęs bendrus patarimus, „Sonnet 5“ reprezentuoja posūkį link programinės įrangos, kuri prisiima atsakomybę už užduotį. Stebėkite savo skaitmeninius įpročius per ateinančius kelis mėnesius. Tikėtina, pastebėsite, kad trintis tarp idėjos turėjimo ir jos įgyvendinimo pradeda nykti, nes šie pigesni ir greitesni agentai tampa nematomu kasdien naudojamų programėlių pagrindu. Svarbiausias vartotojo įgūdis nebėra mokėjimas užduoti klausimą, o mokėjimas valdyti skaitmeninę darbo jėgą.

Šaltiniai: Anthropic official blog, Zapier engineering statements, Lovable press release, Gemini 3.5 Flash launch data, OpenAI GPT-5.6 Sol preview documentation.

bg
bg
bg

Iki pasimatymo kitoje pusėje.

Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.

/ Sukurti nemokamą paskyrą