Written By Ashutosh Ojha
Edited By: Ashutosh Ojha | Published By: Ashutosh Ojha | Published: Feb 09, 2026, 03:40 PM (IST)
Sarvam AI
और पढें: भारत में ChatGPT Go एक साल के लिए फ्री, 4 नवंबर से मिलेगा फायदा
भारत अब सिर्फ AI का Consumer नहीं, बल्कि उसे बनाने वाला देश भी बनता जा रहा है। बेंगलुरु स्थित स्टार्टअप Sarvam AI ने यह साबित कर दिया है कि भारत भी वर्ल्ड-क्लास आर्टिफिशियल इंटेलिजेंस मॉडल बना सकता है, खासकर भारत से जुड़ी जरूरतों के लिए। कंपनी ने हाल ही में अपना नया OCR Tools Sarvam Vision लॉन्च किया है, जिसने भारतीय भाषाओं में डॉक्यूमेंट पढ़ने और समझने के मामले में Google Gemini, ChatGPT और Anthropic Claude जैसे बड़े AI मॉडल्स को पीछे छोड़ दिया है। इसके साथ ही Sarvam का AI वॉयस मॉडल Bulbul V3 भी काफी चर्चा में है, जो भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज तैयार करता है।
🚨 BREAKING: Made in India ‘Sarvam AI’ beats Gemini and ChatGPT in Optical Character Recognition (OCR), Indian-language document reading, text-to-speech and AI voice generation. pic.twitter.com/5PsNJA6Epp
— Beats in Brief 🗞️ (@beatsinbrief) February 9, 2026
अब तक AI की दुनिया में अमेरिका और चीन का दबदबा माना जाता था। भारत के पास टैलेंट और स्केल होने के बावजूद, उसे कोर AI डेवलपमेंट का लीडर नहीं माना जाता था लेकिन Sarvam AI इस सोच को बदल रहा है। कंपनी खुद को ‘Sovereign AI’ बनाने वाली संस्था बताती है यानी ऐसा AI जो भारत में बना हो और भारत की जरूरतों पर केंद्रित हो। Sarvam AI के को-फाउंडर प्रत्युष कुमार ने सोशल मीडिया प्लेटफॉर्म X पर बताया कि Sarvam Vision ने olmOCR-Bench में 84.3% की सटीकता हासिल की है, जो Gemini 3 Pro और DeepSeek OCR v2 जैसे टूल्स से बेहतर है, जबकि ChatGPT का स्कोर काफी कम रहा।
Indian AI quietly beats global giants on OCR and speech benchmarks 👀
Sarvam Vision, an OCR and document understanding model from Sarvam AI, scored 84.3% accuracy on the olmOCR Bench, outperforming models from Google Gemini, Claude, and ChatGPT—especially on Indian scripts and… pic.twitter.com/pDwHc01tgZ
— SciTech Era (@SciTechera) February 9, 2026
इतना ही नहीं Sarvam Vision ने OmniDocBench v1.5 जैसे कठिन बेंचमार्क पर भी शानदार प्रदर्शन किया है। इस टेस्ट में यह देखा जाता है कि AI असली दुनिया के मुश्किल डॉक्यूमेंट जैसे Technical table, Mathematical फॉर्मूले और उलझे हुए लेआउट को कितनी अच्छी तरह समझ पाता है। Sarvam Vision ने इसमें कुल 93.28% स्कोर किया, जो बताता है कि यह टूल उन जगहों पर भी बेहतर काम करता है, जहां पुराने OCR सिस्टम अक्सर फेल हो जाते हैं। इस प्रदर्शन के बाद Sarvam AI को लेकर पहले की शंकाएं अब तारीफ में बदल रही हैं। टेक कमेंटेटर Deedy Das ने भी माना कि उन्होंने Sarvam को पहले कम आंका था और अब यह भारतीय भाषाओं के लिए एक बहुत बड़ी कमी को पूरा कर रहा है।
OCR के अलावा Sarvam AI ने अपना नया Text-To-Speech मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक, भावनात्मक और स्थिर आवाज तैयार करने में सक्षम है। Bulbul V3 फिलहाल 11 भारतीय भाषाओं में 35 से ज्यादा आवाजों को सपोर्ट करता है और आगे चलकर 22 भाषाओं तक विस्तार की योजना है, कई यूजर्स और स्टार्टअप्स ने इसकी तारीफ की है। KissanAI के फाउंडर प्रतीक देसाई ने कहा कि Indic भाषाओं के लिए Bulbul उनका पसंदीदा TTS मॉडल बन चुका है और इसकी कीमत भी विदेशी टूल्स जैसे ElevenLabs के मुकाबले ज्यादा समझदारी भरी है।