While the world was busy marveling at how a small Chinese startup could suddenly produce AI that rivals the giants of Silicon Valley for a fraction of the price, a more cynical reality was brewing in the halls of Washington. For months, the tech community has debated whether companies like DeepSeek are simply more efficient or if they’ve found a shortcut. This week, the U.S. State Department officially weighed in, and their verdict is far from flattering.
In a diplomatic cable recently sent to embassies worldwide, the U.S. government has sounded a global alarm. The message is clear: the low-cost AI tools currently flooding the market aren't just disruptive; they are, allegedly, the product of a massive, surreptitious effort to strip-mine American innovation. While it’s tempting to view this as just another round of geopolitical chest-thumping, the implications for the average user go far deeper than trade tariffs or diplomatic spats.
Norėdami suprasti Valstybės departamento įspėjimo rimtumą, turime pažvelgti į procesą, vadinamą „distiliacija“ (angl. distillation). Mašininio mokymosi pasaulyje pamatinių modelių, tokių kaip „OpenAI“ GPT-4, mokymas yra neįtikėtinai brangus uždavinys, kainuojantis šimtus milijonų dolerių skaičiavimo galios ir žmonių priežiūros.
Iš esmės distiliacija yra būdas sukurti mažesnį, efektyvesnį DI, naudojant didesnio ir brangesnio modelio rezultatus kaip mokytoją. Pagalvokite apie tai taip: jei „OpenAI“ praleistų dešimtmetį ir išleistų milijardą dolerių mokydama virtuvės šefą, konkuruojanti įmonė galėtų tiesiog sėdėti valgomajame, ragauti kiekvieną šefo pagamintą patiekalą ir užsirašyti receptus pagal skonį. Jiems nereikėjo lankyti kulinarijos mokyklos ar eksperimentuoti su tūkstančiais nepavykusių padažų; jie tiesiog „distiliavo“ meistro žinias į pigesnę receptų knygą.
Žvelgiant plačiau, JAV vyriausybė teigia, kad tokios įmonės kaip „DeepSeek“, „Moonshot AI“ ir „MiniMax“ ne tik semiasi įkvėpimo iš Amerikos modelių – jos faktiškai naudoja juos kurdamos savo pakaitalus. Už žargono slepiasi tai, ką Valstybės departamentas vadina „išgavimu ir distiliacija“. Maitindamos nuosavybinio modelio aukštos kokybės atsakymus į naują, mažesnę sistemą, šios įmonės gali atkartoti didžiąją dalį našumo be pradinių mokslinių tyrimų ir plėtros (MTEP) išlaidų.
Vidutiniam vartotojui pigesnis ir greitesnis DI atrodo kaip laimėjimas. Kam mokėti mėnesinę prenumeratą už „ChatGPT“, jei nemokama arba pigi „DeepSeek“ alternatyva lyginamuosiuose testuose veikia panašiai? Tačiau Valstybės departamento telegramoje pabrėžiama sisteminė rizika, kurią daugelis vartotojų ignoruoja.
Kai modelis distiliuojamas slapta, šis procesas dažnai pašalina nematomą originalios sistemos stuburą: jos saugumo protokolus ir etines apsaugos priemones. Telegramoje įspėjama, kad šiems „distiliuotiems“ modeliams trūksta mechanizmų, užtikrinančių, kad DI būtų ideologiškai neutralus ir siektų tiesos.
Kitaip tariant, kai kopijuojate receptą ragaudami galutinį patiekalą, nepastebite saugos įspėjimų, kurių laikėsi originalus šefas – pavyzdžiui, nepervirti vištienos ar palaikyti virtuvės švarą. Skaitmeninėje erdvėje tai reiškia, kad distiliuotas modelis gali būti labiau linkęs generuoti kenkėjišką kodą, platinti dezinformaciją arba nesugebėti apsaugoti vartotojo duomenų, nes originalaus DI „saugumo sluoksnis“ nebuvo pilnai užfiksuotas distiliacijos proceso metu.
Istoriškai technologijų karas tarp JAV ir Kinijos buvo sutelktas į techninę įrangą – konkrečiai į aukščiausios klasės mikroschemas, kurios tarnauja kaip šiuolaikinio amžiaus skaitmeninė žalia nafta. Tačiau Kinijai tampant atsparesnei techninės įrangos gamyboje (tai pabrėžia neseniai pasirodęs „DeepSeek“ V4 modelis, optimizuotas „Huawei“ lustams), konfliktas persikėlė aukščiau – į programinę įrangą ir pačius duomenis.
| Funkcija | Nuosavybiniai JAV modeliai (pvz., OpenAI) | Įtariami distiliuoti modeliai (pvz., DeepSeek) |
|---|---|---|
| Kūrimo kaina | Ypač didelė (pagrindiniai MTEP) | Maža (esamų rezultatų tobulinimas) |
| Mokymo duomenys | Masinis tinklalapių nuskaitymas + žmonių grįžtamasis ryšys | Sintetiniai duomenys iš didesnių modelių |
| Saugumo protokolai | Tvirtos, daugiasluoksnės apsaugos priemonės | Dažnai pašalinti arba apeiti |
| Rinkos kainodara | Mastelio požiūriu lanksti, bet brangi | Agresyviai pigi / nemokama |
| Našumas | Didelis visose srityse | Didelis tik specifiniuose testuose |
Įdomu tai, kad Kinija atmetė šiuos kaltinimus kaip „nepagrįstus išpuolius“ prieš jų vystymąsi. Jie teigia, kad jų pažanga yra vietinių inovacijų ir teisėto duomenų rinkimo rezultatas. Visgi šio pasaulinio įspėjimo laikas nėra atsitiktinis. Prezidentui Trumpui netrukus planuojant susitikti su prezidentu Xi Pekine, JAV kloja pamatus griežtesnei pozicijai dėl DI intelektinės nuosavybės. Tai nėra tik lokalus ginčas; tai bandymas nustatyti pasaulinį standartą, kaip DI gali ir negali būti kuriamas.
Vartotojo požiūriu gali atrodyti, kad tiesiog renkatės tarp dviejų skirtingų programinės įrangos prekių ženklų. Tačiau šis pasirinkimas turi apčiuopiamų pasekmių.
Pirma, tai duomenų privatumo klausimas. Daugelis Vakarų vyriausybių jau uždraudė savo pareigūnams naudoti „DeepSeek“, motyvuodamos susirūpinimu, kad vartotojų duomenis gali pasiekti užsienio subjektai. Vidutiniam vartotojui naudojimasis DI modeliu, kuriame „pašalinti saugumo protokolai“, reiškia, kad jūsų užklausos ir asmeninė informacija gali būti tvarkoma ne taip rūpestingai, kaip tikėtumėtės iš reguliuojamos vietinės įmonės.
Antra, tai patikimumo klausimas. Valstybės departamento telegramoje pažymėta, kad šie modeliai dažnai atrodo gerai atliekantys pasirinktus testus, tačiau nesugeba atkartoti „viso našumo“ kaip originali sistema. Šiandien galite gauti puikų atsakymą į programavimo klausimą, tačiau rytoj modelis gali haliucinuoti arba pateikti pavojingai klaidingą informaciją, nes jam trūksta pamatinių žinių, kurios įgyjamos per visą mokymo ciklą.
Galiausiai DI pramonė tampa vis labiau neskaidri. Modeliai tampa vis paprastesni ir patogesni vartotojui, tačiau jų kūrimo metodus tampa vis sunkiau atsekti. Žmogui, sėdinčiam prie savo stalo ir bandančiam parengti el. laišką ar parašyti kodo fragmentą, DI kilmė gali atrodyti nesvarbi. Tačiau ilgalaikėje perspektyvoje visos pramonės sveikata priklauso nuo sąžiningų žaidimo taisyklių.
Jei įmonės, atliekančios sunkiausią darbą – investuojančios milijardus į pamatinius tyrimus – pamatys, kad jų darbas akimirksniu distiliuojamas ir parduodamas visuomenei už centus, paskata naujovėms ilgainiui išseks. Tai cikliška problema: jei meistrai virėjai bus išstumti iš verslo tų, kurie kopijuoja jų receptus, galiausiai nebebus naujų receptų, kuriuos kas nors galėtų kopijuoti.
Praktiškai kalbant, žengiame į erą, kai turite būti tokie pat skeptiški savo DI teikėjo atžvilgiu, kaip ir savo banko ar gydytojo. „Nenuilstantis praktikantas“, kuris yra jūsų DI asistentas, yra tik tiek geras, kiek etikos ir pastangų buvo įdėta į jo išsilavinimą.
Žvelgiant į ateitį, esmė ta, kad „nemokamas“ arba „pigus“ DI, kurį naudojate, gali turėti paslėptą kainą. Nesvarbu, ar ta kaina yra jūsų privatumas, jūsų saugumas, ar ilgalaikis technologijų pramonės stabilumas – tai kaina, dėl kurios šiuo metu deramasi diplomatinėse telegramose dar gerai prieš tai, kai jūs spustelite „Sutinku“ paslaugų teikimo sąlygų puslapyje.
Šaltiniai:



Pašto ir debesies saugojimo sprendimas suteikia galingiausias saugaus keitimosi duomenimis priemones, užtikrinančias jūsų duomenų saugumą ir privatumą.
/ Sukurti nemokamą paskyrą