डेवलपर्स हफ्तों से शिकायत कर रहे थे। एंथ्रोपिक (Anthropic) का पिछला फ्लैगशिप AI, Claude Opus 4.6, सुस्त महसूस होने लगा था। GitHub थ्रेड्स, Reddit पोस्ट और X (ट्विटर) पर "AI श्रिंकफ्लेशन" (AI shrinkflation) की कहानियों का अंबार लग गया था—वह कचोटने वाला अहसास कि जिस मॉडल के लिए उन्होंने भुगतान किया, उसने चुपचाप खराब प्रदर्शन करना शुरू कर दिया। एंथ्रोपिक ने कंप्यूट बचाने के लिए वेट्स (weights) में बदलाव से इनकार किया, लेकिन संदेह बना रहा। फिर, 16 अप्रैल, 2026 को, उन्होंने Claude Opus 4.7 लॉन्च किया। यह उनका अब तक का सबसे सक्षम Opus है, जो अब सामान्य रूप से उपलब्ध है, और शुरुआती परीक्षण पुष्टि करते हैं कि इसने उस धार को वापस पा लिया है जिसे उपयोगकर्ता मिस कर रहे थे।
सरल शब्दों में, यह पूरी तरह से कायाकल्प नहीं है। यह शिकायतों को सीधे संबोधित करने वाला एक लक्षित अपग्रेड है। उपयोगकर्ता कठिन कोडिंग कार्य—जैसे किसी बड़े ऐप को डीबग करना या किसी नए फीचर की रूपरेखा तैयार करना—कम मार्गदर्शन के साथ इसे सौंप रहे हैं। लेकिन यह कोई रामबाण नहीं है। तकनीकी शब्दावली के पीछे, Opus 4.7 रीजनिंग और कोड के बेंचमार्क में चमकता है, फिर भी यह टोकन को ऐसे गटकता है जैसे कोई अथक इंटर्न आपके स्नैक बजट को चट कर रहा हो।
एंथ्रोपिक की घोषणा कोडिंग और रीजनिंग टेस्ट में Opus 4.7 के चार्ट में शीर्ष पर रहने पर प्रकाश डालती है। स्वतंत्र मूल्यांकन भी इसका समर्थन करते हैं। कोड जनरेशन के लिए HumanEval जैसे मानक मेट्रिक्स पर, यह अपने पूर्ववर्तियों और OpenAI और Google के प्रतिद्वंद्वियों से आगे निकल जाता है। रीजनिंग कार्य, जहाँ AI को चरण-दर-चरण तर्क को जोड़ना होता है, वहाँ भी ठोस लाभ दिखाई देते हैं।
यहाँ प्रमुख बेंचमार्क की एक त्वरित तुलना दी गई है (एंथ्रोपिक के डेटा और थर्ड-पार्टी रन के आधार पर):
| बेंचमार्क | Opus 4.6 | Opus 4.7 | सुधार |
|---|---|---|---|
| HumanEval (कोडिंग) | 88% | 92% | +4% |
| GPQA (रीजनिंग) | 52% | 57% | +5% |
| MATH (गणित की समस्याएं) | 71% | 75% | +4% |
ये कोई क्रांतिकारी छलांग नहीं हैं, लेकिन वास्तविक काम के लिए पर्याप्त मजबूत हैं। औसत उपयोगकर्ता के लिए, इसका मतलब उन निराशाजनक लूपों में कमी है जहाँ AI आधा-अधूरा कोड देता है। एक साधारण वेब स्क्रेपर बनाने के लिए प्रॉम्प्ट देने की कल्पना करें: Opus 4.7 न केवल साफ-सुथरा Python कोड लिखता है, बल्कि अपने तर्क को स्पष्ट रूप से समझाता है, जैसे गणित की कक्षा में अपना काम दिखाना।
दिलचस्प बात यह है कि यह पारदर्शिता जोर से प्रदर्शित "चेन-ऑफ-थॉट" (chain-of-thought) रीजनिंग के माध्यम से आती है। आप मॉडल को जोर से विचार करते हुए देखते हैं—"पहले, HTML को पार्स करें; अगला, लिंक निकालें; डुप्लिकेट से बचने के लिए..."—जो आउटपुट को अधिक भरोसेमंद बनाता है। व्यावहारिक रूप से, यह एक जूनियर डेवलपर द्वारा अपनी प्रक्रिया का वर्णन करने जैसा है, जिससे हर लाइन को दोबारा जांचने की आवश्यकता कम हो जाती है।
शक्ति की एक कीमत होती है। Opus 4.7 एक टोकन खाने वाली मशीन है। टोकन AI चैट की मुद्रा हैं—आपके प्रॉम्प्ट और प्रतिक्रिया के हर शब्द की कीमत होती है। X और डेवलपर फ़ोरम पर उपयोगकर्ता रिपोर्टों के अनुसार, यह मॉडल 4.6 की तुलना में प्रति इंटरैक्शन 20-30% अधिक टोकन खर्च करता है। क्यों? क्योंकि वह दृश्यमान रीजनिंग श्रृंखला आउटपुट की लंबाई को बढ़ा देती है।
बाजार की तरफ देखें तो, मूल्य निर्धारण इनपुट/आउटपुट आधारित रहता है: Opus टियर के लिए लगभग $15 प्रति मिलियन इनपुट टोकन, $75 प्रति मिलियन आउटपुट (लॉन्च के समय एंथ्रोपिक की दरें)। एक एकल जटिल कोडिंग सत्र में $5-10 का खर्च आ सकता है, जबकि पहले यह $3-7 था। शौकिया उपयोगकर्ताओं या छोटी टीमों के लिए, यह तब तक स्केलेबल है जब तक कि यह बजट से बाहर न हो जाए—पुनरावृत्ति वाले काम के दौरान बजट जल्दी खत्म हो जाता है।
दूसरे तरीके से कहें तो, टोकन को डिजिटल ईंधन के रूप में सोचें। Opus 4.7 का इंजन अधिक शक्तिशाली है, इसलिए यह अधिक गैस गटकता है। होम ऑटोमेशन की स्क्रिप्टिंग करने वाले या स्प्रेडशीट का विश्लेषण करने वाले रोजमर्रा के उपयोगकर्ता शायद इसे नोटिस न करें। लेकिन ऐप बनाने वाले पेशेवर? बिलों के बढ़ने की उम्मीद करें, खासकर यदि आप प्रॉम्प्ट को बेरहमी से ऑप्टिमाइज़ नहीं कर रहे हैं।
यदि व्यापक रूप से देखें, तो Opus 4.7 वह शक्तिशाली मॉडल नहीं है जिसे एंथ्रोपिक ने विशिष्ट भागीदारों के लिए आरक्षित रखा है। वह Claude Mythos है, एक विवादास्पद पावरहाउस जिसे चुनिंदा रूप से पेश किया जाता है। लीक और अफवाहें बताती हैं कि Mythos हर मोर्चे पर सार्वजनिक मॉडल को पछाड़ देता है, लेकिन नियामक बाधाएं और सुरक्षा चिंताएं इसे सीमित रखती हैं। Opus 4.7 उपभोक्ता-अनुकूल संस्करण है—मजबूत, लेकिन नियंत्रित।
ऐतिहासिक रूप से, यह बिग टेक की रणनीति को दर्शाता है: सार्वजनिक रूप से सुधारों को धीरे-धीरे देना जबकि मुख्य संपदा को छिपा कर रखना। एंथ्रोपिक का PR इसे जिम्मेदार स्केलिंग के रूप में पेश करता है। यहाँ थोड़ा संदेह है—4.6 की समस्याओं के बाद, यह अपारदर्शी मॉडल संशोधनों की एक प्रणालीगत समस्या पर बैंड-एड जैसा महसूस होता है। X पर डेवलपर मजाक करते हैं कि 4.7 में "शुरुआती 4.6 वाली वाइब्स" हैं, कथित तौर पर प्रदर्शन कम किए जाने से पहले वाली।
उपभोक्ता के नजरिए से, आप अभी तक Mythos को मिस नहीं कर रहे हैं। यह अधिकांश के लिए बहुत अधिक होगा, और महंगा भी। लेकिन यह AI के बदलते परिदृश्य को रेखांकित करता है: सार्वजनिक उपकरण आगे बढ़ते हैं, फिर भी वास्तविक व्यवधान NDA के पीछे छिपा होता है।
हुड के नीचे, Opus 4.7 वर्कफ़्लो को सुव्यवस्थित करता है। मुझे अपने तकनीकी विश्लेषण के दिनों में इसी तरह के अपग्रेड का परीक्षण करना याद है—अचानक, प्रॉम्प्ट को ठीक करने में लगने वाले घंटों का काम मिनटों में सिमट जाता है। ईमेल अभियान तैयार करने वाला एक मार्केटर? यह दर्शकों के विभाजन के माध्यम से सहजता से तर्क करता है। भौतिकी की समस्याओं से जूझ रहा एक छात्र? चरण-दर-चरण विवरण समझ विकसित करते हैं।
इसके विपरीत, टोकन की वृद्धि का असर असमान रूप से पड़ता है। कम मार्जिन पर काम करने वाले फ्रीलांसर इसे सबसे अधिक महसूस करते हैं—ऑप्टिमाइज़ करें या भुगतान करें। API बजट वाले उद्यम? उनके लिए यह नगण्य है। दैनिक जीवन में, यदि आप Poe जैसे ऐप के माध्यम से या सीधे एंथ्रोपिक की साइट पर Claude का उपयोग कर रहे हैं, तो उपयोग पर नज़र रखें। फ्री टियर जल्दी खत्म हो जाते हैं; सशुल्क प्लान $20/माह से शुरू होते हैं लेकिन भारी उपयोग के साथ बढ़ते जाते हैं।
आपके लिए इसका क्या अर्थ है: स्मार्ट AI सहायक यहाँ हैं, जो पेशेवर स्तर की कोडिंग और विश्लेषण का लोकतंत्रीकरण कर रहे हैं। लेकिन इसे एक प्रीमियम टूल की तरह समझें—उसी के अनुसार बजट बनाएं। अब मीटर पर नज़र डाले बिना अनंत चैट नहीं की जा सकेगी।
4.6 का विरोध कोई अकेली घटना नहीं थी। AI में यह चक्रीय है: मॉडल धमाकेदार तरीके से लॉन्च होते हैं, फिर दक्षता के लिए ऑप्टिमाइज़ किए जाते हैं, कभी-कभी गुणवत्ता की कीमत पर। एंथ्रोपिक की प्रतिक्रिया—त्वरित अपग्रेड—दिखाती है कि वे सुन रहे हैं। फिर भी जानबूझकर किए गए डाउनग्रेड से इनकार करना अविश्वास को बढ़ावा देता है। परिवर्तनों की पारदर्शी लॉगिंग इसे ठीक कर सकती है, लेकिन इसकी उम्मीद कम ही रखें।
भविष्य की ओर देखें तो, पैटर्न के अनुसार गर्मियों तक Opus 4.8 की उम्मीद करें। जैसे-जैसे ट्रेनिंग के नए तरीके सामने आएंगे, टोकन दक्षता में सुधार हो सकता है। व्यापक प्रभाव? सस्ता, स्मार्ट AI प्रतिद्वंद्वियों पर दबाव डालता है, जिससे संभावित रूप से पूरे उद्योग में लागत कम हो जाती है। फिलहाल, Opus 4.7 ने मानक को फिर से स्थापित कर दिया है।
अंततः, अपना दृष्टिकोण बदलें: AI कोई मुफ्त जादू नहीं है। यह एक लचीला उपकरण है, जो समझौतों के बीच विकसित हो रहा है। अगली बार जब आप कोड के लिए प्रॉम्प्ट दें, तो इसकी दृश्यमान बुद्धिमत्ता की सराहना करें—और टोकन बचाने के लिए उन शब्दबहुल श्रृंखलाओं को छोटा करें। आपकी परिष्कृत डिजिटल आदतें ही इसकी पूरी क्षमता को उजागर करेंगी।



हमारा एंड-टू-एंड एन्क्रिप्टेड ईमेल और क्लाउड स्टोरेज समाधान सुरक्षित डेटा एक्सचेंज का सबसे शक्तिशाली माध्यम प्रदान करता है, जो आपके डेटा की सुरक्षा और गोपनीयता सुनिश्चित करता है।
/ एक नि: शुल्क खाता बनाएं