जबकि लोकप्रिय आख्यान अक्सर यह सुझाव देते हैं कि कृत्रिम बुद्धिमत्ता (AI) के लिए सबसे बड़ी बाधा उच्च गुणवत्ता वाले मानव साहित्य या जटिल कोडिंग तर्क की कमी है, वास्तविकता कहीं अधिक सूक्ष्म और स्पष्ट रूप से, बहुत गहरी है। उद्योग एक ऐसे बिंदु पर पहुँच गया है जहाँ दुनिया की सभी किताबें पढ़ना अब पर्याप्त नहीं है। अगले स्तर पर जाने के लिए, एआई को यह सीखने की ज़रूरत है कि कैसे चला जाए। इसे यह जानने की ज़रूरत है कि हम कैसे क्लिक करते हैं, हम कैसे हिचकिचाते हैं, और हम आधुनिक सॉफ़्टवेयर के भूलभुलैया जैसे मेनू को कैसे नेविगेट करते हैं।
रॉयटर्स द्वारा पहली बार रिपोर्ट किए गए एक हालिया घटनाक्रम में, मेटा ने पुष्टि की है कि वह अब अपने स्वयं के कार्यबल का उपयोग एक जीवित प्रयोगशाला के रूप में कर रहा है। अपने कर्मचारियों के कीस्ट्रोक्स और माउस मूवमेंट को रिकॉर्ड करके, यह सोशल मीडिया दिग्गज एक ऐसे एआई जो कविता लिख सकता है और एक ऐसे एआई जो वास्तव में आपकी ओर से कंप्यूटर का उपयोग कर सकता है, के बीच की खाई को पाटने का प्रयास कर रहा है। बड़ी तस्वीर को देखते हुए, यह सिर्फ एक विचित्र आंतरिक प्रयोग नहीं है; यह हमारे युग के डिजिटल कच्चे तेल को निकालने के तरीके में एक मौलिक बदलाव है।
पिछले कई वर्षों से, एआई क्रांति पाठ (text) द्वारा संचालित रही है। जीपीटी-4 या मेटा के अपने लामा (Llama) जैसे लार्ज लैंग्वेज मॉडल्स (LLMs) को इंटरनेट के सामूहिक आउटपुट—ब्लॉग, रेडिट थ्रेड्स, डिजिटाइज़्ड किताबों और ओपन-सोर्स कोड पर प्रशिक्षित किया गया था। इसने एआई की एक ऐसी पीढ़ी बनाई जो अविश्वसनीय रूप से स्पष्ट है लेकिन अनिवार्य रूप से पंगु है। यह आपको बता सकता है कि फ्लाइट कैसे बुक करें, लेकिन यह आपके लिए ब्राउज़र नहीं खोल सकता, ट्रैवल साइट पर नहीं जा सकता, तारीखें नहीं चुन सकता और 'खरीदें' बटन पर क्लिक नहीं कर सकता।
उद्योग जिसे 'एजेंटिक' (agentic) एआई कहता है—ऐसे उपकरण जो बहु-चरणीय डिजिटल कार्यों को करने में सक्षम एक अथक इंटर्न के रूप में कार्य करते हैं—बनाने के लिए डेवलपर्स को एक अलग प्रकार के डेटा की आवश्यकता होती है। उन्हें परिधीय उपकरणों (peripheral devices) के माध्यम से व्यक्त मानवीय इरादे के रोडमैप की आवश्यकता है। अनिवार्य रूप से, मेटा डिजिटल कार्य के 'संयोजी ऊतक' (connective tissue) की तलाश कर रहा है। जब कोई कर्मचारी ड्रॉपडाउन मेनू पर क्लिक करता है, दो सेकंड के लिए रुकता है, और फिर एक विशिष्ट उप-विकल्प चुनता है, तो वे तर्क का एक ऐसा पाठ प्रदान कर रहे होते हैं जिसे केवल पाठ (text) व्यक्त नहीं कर सकता।
शब्दजाल के पीछे, यह मशीनों को सॉफ़्टवेयर की भौतिक लय सिखाने के बारे में है। जबकि एक इंसान 'सबमिट' बटन देखता है, कंप्यूटर स्क्रीन पर एक निर्देशांक (coordinate) देखता है। इन लाखों इंटरैक्शन को कैप्चर करके, मेटा ऐसे मॉडल बनाने की उम्मीद करता है जो उपयोगकर्ता के लक्ष्य और उसे प्राप्त करने के लिए आवश्यक क्लिकों के बीच व्यवस्थित संबंध को समझते हों।
मेटा के दृष्टिकोण में विशिष्ट अनुप्रयोगों में इनपुट कैप्चर करने के लिए डिज़ाइन किया गया एक नया आंतरिक उपकरण शामिल है। कंपनी के अनुसार, इसमें माउस मूवमेंट और बटन क्लिक से लेकर कर्मचारियों द्वारा नेस्टेड मेनू को नेविगेट करने के तरीके तक सब कुछ शामिल है। तकनीकी वास्तुकला के दृष्टिकोण से, यह एक विशाल टेलीमेट्री परियोजना है। कल्पना कीजिए कि कर्सर की हर हलचल को एक डेटा बिंदु में बदल दिया जा रहा है जो एक न्यूरल नेटवर्क को यह समझने में मदद करता है कि एक निश्चित आइकन 'एडिट' का प्रतिनिधित्व करता है जबकि दूसरा 'डिलीट' का।
व्यावहारिक रूप से कहें तो, यह डेटा अविश्वसनीय रूप से उच्च-रिज़ॉल्यूशन वाला है। यह केवल अंतिम क्रिया के बारे में नहीं है; यह वहां तक पहुँचने के लिए अपनाए गए मार्ग के बारे में है। औसत उपयोगकर्ता के लिए, यह बहुत अधिक लग सकता है, लेकिन एक मशीन के लिए, 'गलत' चालें भी 'सही' चालों की तरह ही शिक्षाप्रद होती हैं। यदि कोई कर्मचारी गलती से गलत टैब पर क्लिक करता है और तुरंत उसे सुधारता है, तो एआई सामान्य मानवीय गलतियों और उनसे बचने के तरीके के बारे में सीखता है।
मेटा ने तुरंत स्पष्ट किया है कि संवेदनशील सामग्री की सुरक्षा के लिए सुरक्षा उपाय मौजूद हैं। उनका दावा है कि डेटा का उपयोग प्रदर्शन समीक्षा या प्रशिक्षण के अलावा किसी अन्य उद्देश्य के लिए नहीं किया जाता है। हालाँकि, 'प्रशिक्षण डेटा' और 'निगरानी' (surveillance) के बीच की रेखा तेजी से धुंधली होती जा रही है। जब कोई कंपनी अपने वर्कस्टेशन के साथ कर्मचारी द्वारा किए जाने वाले हर एक यांत्रिक इंटरैक्शन को रिकॉर्ड करती है, तो कार्यस्थल की गोपनीयता की पारंपरिक सीमाएं समाप्त होने लगती हैं।
मेटा का यह कदम एक व्यापक प्रवृत्ति का हिस्सा है: नए डेटा स्रोतों की हताश खोज। हाल ही में, 'ज़ोंबी' स्टार्टअप्स और बंद हो चुकी कंपनियों के कॉर्पोरेट संचार—जैसे वर्षों के स्लैक (Slack) आर्काइव्स और जीरा (Jira) टिकट्स—को खंगालने और एआई डेवलपर्स को बेचने की खबरें सामने आईं। दूसरे शब्दों में कहें तो, आपके पुराने ऑफिस के मजाक और प्रोजेक्ट मैनेजमेंट की शिकायतों को कल के डिजिटल सहायकों के दिमाग में पुनर्चक्रित (recycle) किया जा रहा है।
| डेटा प्रकार | पारंपरिक स्रोत | उभरता स्रोत (नया डेटा) |
|---|---|---|
| ज्ञान | विकिपीडिया, किताबें, समाचार | आंतरिक स्लैक चैनल, जीरा टिकट |
| तर्क | शोध पत्र, कोड | कर्मचारी कीस्ट्रोक लॉग, क्लिकस्ट्रीम |
| संचार | सार्वजनिक मंच, सोशल मीडिया | निजी कॉर्पोरेट ईमेल, संग्रहीत चैट |
| इंटरैक्शन | उपयोगकर्ता प्रतिक्रिया, ऐप समीक्षाएं | रीयल-टाइम माउस टेलीमेट्री, होवर पैटर्न |
यह बदलाव उद्योग में एक अस्थिर तनाव को उजागर करता है। जैसे-जैसे सार्वजनिक, उच्च-गुणवत्ता वाले पाठ की आपूर्ति कम हो रही है, टेक दिग्गज अंदर की ओर मुड़ रहे हैं या निजी सिलोस (silos) की ओर देख रहे हैं। इसका परिणाम एक मजबूत लेकिन संभावित रूप से दखल देने वाली नई कार्यप्रणाली है। यदि किसी कंपनी को खुले वेब पर पर्याप्त डेटा नहीं मिलता है, तो वे वास्तविक समय में अपने लोगों का अवलोकन करके इसे तैयार करेंगे।
जबकि यह कहानी मेटा के आंतरिक कर्मचारियों पर केंद्रित है, व्यापक जनता के लिए इसके निहितार्थ वास्तविक हैं। हम संभवतः डेटा के 'फ्रीमियम' युग के अंतिम चरणों में प्रवेश कर रहे हैं। वर्तमान में, मेटा अपने स्वयं के कर्मचारियों का उपयोग कर रहा है क्योंकि यह कानूनी रूप से सरल है और एक नियंत्रित वातावरण प्रदान करता है। हालाँकि, एक बार जब ये मॉडल परिष्कृत हो जाते हैं, तो अगला तार्किक कदम इन ट्रैकिंग सुविधाओं को व्यापक दर्शकों के लिए रोल आउट करना है—शायद 'उपयोगकर्ता अनुभव में सुधार' या 'व्यक्तिगत एआई सहायता' की आड़ में।
औसत उपयोगकर्ता के लिए, लब्बोलुआब यह है कि आपका डिजिटल व्यवहार अब आपकी डिजिटल सामग्री से अधिक मूल्यवान है। यह अब केवल इस बारे में नहीं है कि आप इंस्टाग्राम पर क्या पोस्ट करते हैं; यह इस बारे में है कि आप ऐप का उपयोग कैसे करते हैं। आप किसी विशिष्ट विज्ञापन पर कितनी देर तक रुकते हैं? बग की रिपोर्ट करने के लिए आप बटनों के किस क्रम को दबाते हैं? यह जानकारी सहज सॉफ़्टवेयर की अगली पीढ़ी के लिए आधारभूत परत बन रही है।
बाजार के पक्ष को देखें तो, यह प्रतिस्पर्धा के एक नए युग का भी संकेत देता है। माइक्रोसॉफ्ट, गूगल और मेटा जैसी बड़ी कार्यबल और मालिकाना सॉफ़्टवेयर पारिस्थितिकी तंत्र वाली कंपनियों को बहुत बड़ा लाभ है। उनके पास 'प्रशिक्षकों' का एक अंतर्निहित, बंदी दर्शक वर्ग है जिन्हें उसी डेटा को उत्पन्न करने के लिए भुगतान किया जा रहा है जो अंततः उनके अपने काम के कुछ हिस्सों को स्वचालित कर सकता है। यह एक चक्रवाती प्रक्रिया है जो प्रभावशाली और थोड़ी परेशान करने वाली दोनों है।
दिलचस्प बात यह है कि यह कदम बताता है कि एआई का भविष्य केवल 'स्मार्ट' होने के बारे में नहीं है; यह 'काम का' (handy) होने के बारे में है। हम एआई से एक सर्च इंजन के रूप में दूर जा रहे हैं और एक डिजिटल अंग के रूप में एआई की ओर बढ़ रहे हैं। उस लक्ष्य तक पहुँचने के लिए, कंपनियाँ गोपनीयता और डेटा संग्रह की सीमाओं को लांघने के लिए तैयार हैं।
अंततः, तकनीक के लोकतंत्रीकरण के साथ आमतौर पर एक छिपा हुआ कर (tax) आता है। 2000 के दशक की शुरुआत में, वह कर लक्षित विज्ञापनों के लिए हमारी व्यक्तिगत जानकारी थी। 2020 के दशक में, वह कर हमारी यांत्रिक आदतें प्रतीत होती हैं। आज मेटा कर्मचारियों को देखकर, ये मॉडल मानवीय इरादे की बारीकियों को सीख रहे हैं ताकि वे कल हमारी जरूरतों का अनुमान लगा सकें।
जैसे-जैसे हम आगे देखते हैं, यह विचार करने योग्य है कि यह हमारे उपकरणों के साथ हमारे संबंधों को कैसे बदलता है। यदि प्रत्येक क्लिक मशीन के लिए एक सबक है, तो हमारे कंप्यूटर अब केवल स्थिर वस्तुएं नहीं हैं; वे शिष्य हैं। यह अहसास हमें अपनी डिजिटल आदतों को और अधिक बारीकी से देखने के लिए प्रेरित करना चाहिए। क्या हम अपने उपकरणों का उपयोग कर रहे हैं, या हम अनजाने में अपने प्रतिस्थापनों (replacements) को प्रशिक्षित कर रहे हैं?
उपभोक्ता के दृष्टिकोण से, सबसे अच्छा तरीका लचीले संदेह का है। जैसे ही ये 'एजेंटिक' विशेषताएं आपके पसंदीदा ऐप्स में दिखाई देने लगें, याद रखें कि उनके द्वारा प्रदान किया गया सहज अनुभव संभवतः हजारों ट्रैक किए गए कीस्ट्रोक्स की मदद से बनाया गया था। इन डेटा प्रथाओं की पारदर्शिता आने वाले वर्षों में एक प्रमुख युद्धक्षेत्र बनी रहेगी, क्योंकि हम यह तय करेंगे कि थोड़ा अधिक कुशल मंगलवार के बदले में हम अपने 'डिजिटल एग्जॉस्ट' का कितना हिस्सा सौंपने के लिए तैयार हैं।
स्रोत:



हमारा एंड-टू-एंड एन्क्रिप्टेड ईमेल और क्लाउड स्टोरेज समाधान सुरक्षित डेटा एक्सचेंज का सबसे शक्तिशाली माध्यम प्रदान करता है, जो आपके डेटा की सुरक्षा और गोपनीयता सुनिश्चित करता है।
/ एक नि: शुल्क खाता बनाएं