Internetas šiuo metu pilnas žmonių, manančių, kad jų programinė įranga jais manipuliuoja (gaslighting). Per pastarąsias 48 valandas tam tikra „ChatGPT“ vartotojų grupė pradėjo pranešti, kad dirbtinis intelektas (DI) staiga tapo gerokai protingesnis. Šie vartotojai teigia, kad sistema dabar geba sukurti sudėtingus 3D vaizdo žaidimus iš vienos užklausos ir kurti aukščiausios klasės interneto sąsajas, kurios atrodo profesionaliai, o ne robotiškai. Tuo pačiu metu šie vartotojai vieno atsakymo laukia iki valandos.
Nors populiarūs pasakojimai paprastai teigia, kad technologijos tobulėdamos visada greitėja, dabartinė situacija „OpenAI“ viduje rodo priešingai. Gandai rodo slaptą modelio, vadinamo GPT-5.6, diegimą. Nors „OpenAI“ nepatvirtino išleidimo, nepriklausomų testuotojų duomenys rodo, kad esame liudininkai esminio pokyčio, kaip veikia šios skaitmeninės smegenys. Tai nėra paprastas greičio padidinimas. Tai mašinos apdorojamų minčių svorio pokytis.
„OpenAI“ jau anksčiau testavo naujas technologijas be oficialaus pranešimo. Šis procesas vadinamas A/B testavimu. Pagal šį scenarijų bendrovė nedideliam procentui iš milijonų savo vartotojų suteikia naują programinės įrangos versiją, o likęs pasaulis toliau naudojasi senąja. Tikslas – pamatyti, ar naujoji versija iš tikrųjų veikia geriau realiomis sąlygomis, nerizikuojant pasauline nesėkme.
Programuotojas Anshu Chimala neseniai pasidalijo šios patirties įrodymais. Jis paskelbė DI sukurtų pradinių puslapių (landing pages) palyginimą, teigdamas, kad jis buvo vienas iš nedaugelio, gavusių ankstyvą prieigą prie „5.6“ modelio „Pro“ versijos. Jo rezultatai parodė tokį dizaino nušlifavimo lygį, kokį dabartinė vieša versija, GPT-5.5, pasiekia retai. Kiti kūrėjai, pavyzdžiui, Dobroslavas Radosavljevičius, pastebėjo, kad kodavimo asistentas Codex feels entirely different this week.
Kai patyrusiam vartotojui modelis atrodo kitoks, tai paprastai reiškia, kad pasikeitė pagrindinė architektūra. Vidutiniam žmogui tai panašu į tai, tarsi restoranas pakeistų savo standartinę kavą į aukščiausios kokybės rūšį, nepakeisdamas kainos ar iškabos ant durų. Galbūt nežinosite, kodėl kava skanesnė, bet pastebėsite skirtumą savo rytinėje rutinoje.
Nuosekliausias naujo modelio įrodymas yra laikrodis. DI pasaulyje greitis paprastai yra prioritetas. Tačiau vartotojai, tokie kaip Conor Dart, praneša, kad 3D naršyklės žaidimo užklausa, kuri anksčiau trukdavo 10 minučių, dabar trunka ilgiau nei valandą. Šis didžiulis sulėtėjimas yra kompromisas dėl kokybės. Įtariamas GPT-5.6 modelis ne tik spėlioja kitą žodį. Jis atlieka tai, ką tyrėjai vadina mąstymo pastangomis (reasoning effort).
Įsivaizduokite tai kaip pavargusį praktikantą. Jei užduosite klausimą ir pareikalausite atsakymo per penkias sekundes, praktikantas pateiks pirmą į galvą šovusį dalyką. Jei tam pačiam praktikantui duosite valandą pagalvoti, jis galės patikrinti savo darbą, paieškoti klaidų ir sukurti kažką daug stabilesnio.
Nutekintos detalės iš tokių šaltinių kaip Pankaj Kumar rodo, kad „OpenAI“ padidino nustatymą, vadinamą Juice Value, nuo 768 iki 960. Paprastai tariant, ši vertė reprezentuoja skaičiavimo biudžetą, kurį DI leidžiama išleisti vienai užduočiai. Didesnis biudžetas reiškia, kad DI yra kruopštesnis. Prieš parodydamas rezultatą, jis patikrina 3D žaidimo fiziką arba kosminio laivo geometriją. Štai kodėl testuotojas, vardu Chris, pamatė, kad jo kosminio laivo generavimo laikas šoktelėjo nuo 34 minučių naudojant GPT-5.5 iki 87 minučių naudojant įtariamą naująjį modelį. DI atlieka daugiau darbo užkulisiuose.
„OpenAI“ nedirba vakuume. Šio įtariamo diegimo laikas yra reakcija į pasaulinę konkurenciją. Kinija turi naują atvirojo kodo modelį GLM-5.2, kuris šiuo metu lenkia GPT-5.5 inžineriniuose testuose (benchmarks). Šie testai matuoja, kaip gerai DI gali susidoroti su kelias valandas trunkančiu projektu neprarandant tikslo. Jei „OpenAI“ praras lyderystę inžinerijoje, ji praras įtaką aukščiausios klasės kūrėjų rinkoje.
Anthropic, Claude DI kūrėja, taip pat yra svarbus veiksnys. Jų geriausi modeliai, Mythos 5 ir Fable 5, šiuo metu yra įsipainioję į politinę kovą dėl eksporto kontrolės. Tai sukūrė laikiną vakuumą industrijos viršūnėje. „OpenAI“ turi galimybę pritraukti vartotojus, kurie yra nusivylę „Anthropic“ nepasiekiamumu.
Taip pat tiksi finansinis laikrodis. Tiek „OpenAI“, tiek Anthropic ruošiasi galimiems pirminiams viešiesiems akcijų siūlymams (IPO). Norėdama pritraukti investuotojų, „OpenAI“ turi įrodyti, kad vis dar gali diegti naujoves greičiau nei jos konkurentai. Šis spaudimas paaiškina, kodėl bendrovė gali būti pasirengusi išleisti modelį, kuris yra lėtesnis, bet gerokai pajėgesnis. Aukščiausios klasės vartotojai mokės už kokybę, net jei jiems teks laukti rezultato.
Vidutiniam žmogui šie gandai pranašauja pokyčius, kaip mes naudojame DI įrankius. Mes traukiamės iš momentinių, paviršutiniškų atsakymų eros į lėto, gilaus darbo erą. Praktiškai kalbant, šis pokytis paveiks jūsų darbo eigą ir jūsų piniginę.
Jei šie pranešimai yra tikslūs, kita „ChatGPT“ versija apims žinių ribą iki 2025 m. gruodžio mėn. Ji taip pat bus daug geresnė atliekant vizualines užduotis, tokias kaip SVG dizainas ir 3D modeliavimas. Dėl to DI tampa naudingesniu įrankiu smulkiojo verslo savininkams ir kūrybos profesionalams, kuriems reikia aukštos kokybės išteklių nesamdant visos dizainerių komandos.
Tačiau ši galia turi savo kainą. Pranešama, kad „OpenAI“ svarsto standartinių žetonų (tokens) kainų mažinimą, tačiau aukšto lygio mąstymo modeliai greičiausiai išliks brangūs. Vartotojai turėtų tikėtis pakopinės sistemos, kurioje mokėsite daugiau už „Juice Value“, reikalingą sudėtingoms problemoms spręsti. Jei jums reikia tik greito el. laiško projekto, išliks greitas ir pigus modelis. Jei jums reikia veikiančios 3D simuliacijos, turėsite palaukti ir, galbūt, sumokėti papildomai.
Artėjant gandais apipintai birželio 25 d. išleidimo datai, yra keli dalykai, kuriuos galite padaryti, kad patikrintumėte situaciją. Pirmiausia, jei turite Pro paskyrą, patikrinkite savo nustatymus „ChatGPT“. Kai kurie vartotojai praneša, kad slaptas testavimas vyksta pasirinkus 5.5 Pro modelį. Jei jūsų atsakymo laikas staiga šoktelėjo, o rezultato kokybė pagerėjo, tikriausiai esate A/B testavimo grupės narys.
Antra, stebėkite savo skaitmeninius įpročius. Jei DI užtrunka 40 minučių sugeneruoti atsakymą, negalite jo naudoti tiesioginiam pokalbiui. Turite su juo elgtis kaip su bendradarbiu. Duodate jam užduotį, nueinate užsiimti kuo nors kitu ir grįžtate, kai darbas baigtas. Šis tempo pokytis yra naujos kartos didžiųjų kalbos modelių realybė.
Galiausiai, GPT-5.6 pasirodymas yra susijęs su branda, o ne tik su greičiu. DI industrija peržengia naujovės etapą ir žengia į laikotarpį, kai įrankiai geba atlikti profesionalaus lygio darbą. Nesvarbu, ar „OpenAI“ patvirtins modelį kitą savaitę, ar toliau testuos jį šešėlyje, perėjimas prie aukštesnio lygio mąstymo jau čia.



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą