  • Sarvam Ai India Ai Innovator Outperforms Global Models With Sarvam Vision Bulbul V3 Gemini Chatgpt

भारत के Sarvam AI ने Google Gemini और ChatGPT को दी चुनौती, बेंचमार्क टेस्ट में छोड़ा पीछे

भारत का स्टार्टअप Sarvam AI अब दुनिया के बड़े AI मॉडल्स को टक्कर दे रहा है। उन्होंने अपना नया OCR टूल Sarvam Vision और Text-To-Speech मॉडल Bulbul V3 लॉन्च किया है। ये टूल्स भारतीय भाषाओं में डॉक्यूमेंट और आवाज को समझने और बोलने में Google Gemini और ChatGPT से भी बेहतर साबित हुए हैं। आइए जानते हैं...

Edited By: Ashutosh Ojha | Published By: Ashutosh Ojha | Published: Feb 09, 2026, 03:40 PM (IST)

भारत अब सिर्फ AI का Consumer नहीं, बल्कि उसे बनाने वाला देश भी बनता जा रहा है। बेंगलुरु स्थित स्टार्टअप Sarvam AI ने यह साबित कर दिया है कि भारत भी वर्ल्ड-क्लास आर्टिफिशियल इंटेलिजेंस मॉडल बना सकता है, खासकर भारत से जुड़ी जरूरतों के लिए। कंपनी ने हाल ही में अपना नया OCR Tools Sarvam Vision लॉन्च किया है, जिसने भारतीय भाषाओं में डॉक्यूमेंट पढ़ने और समझने के मामले में Google Gemini, ChatGPT और Anthropic Claude जैसे बड़े AI मॉडल्स को पीछे छोड़ दिया है। इसके साथ ही Sarvam का AI वॉयस मॉडल Bulbul V3 भी काफी चर्चा में है, जो भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज तैयार करता है।

Sarvam Vision ने बड़े AI मॉडल्स को पीछे छोड़ा

अब तक AI की दुनिया में अमेरिका और चीन का दबदबा माना जाता था। भारत के पास टैलेंट और स्केल होने के बावजूद, उसे कोर AI डेवलपमेंट का लीडर नहीं माना जाता था लेकिन Sarvam AI इस सोच को बदल रहा है। कंपनी खुद को Sovereign AI’ बनाने वाली संस्था बताती है यानी ऐसा AI जो भारत में बना हो और भारत की जरूरतों पर केंद्रित हो। Sarvam AI के को-फाउंडर प्रत्युष कुमार ने सोशल मीडिया प्लेटफॉर्म X पर बताया कि Sarvam Vision ने olmOCR-Bench में 84.3% की सटीकता हासिल की है, जो Gemini 3 Pro और DeepSeek OCR v2 जैसे टूल्स से बेहतर है, जबकि ChatGPT का स्कोर काफी कम रहा।

Sarvam Vision ने बेंचमार्क टेस्ट में कैसा प्रदर्शन किया

इतना ही नहीं Sarvam Vision ने OmniDocBench v1.5 जैसे कठिन बेंचमार्क पर भी शानदार प्रदर्शन किया है। इस टेस्ट में यह देखा जाता है कि AI असली दुनिया के मुश्किल डॉक्यूमेंट जैसे Technical table, Mathematical फॉर्मूले और उलझे हुए लेआउट को कितनी अच्छी तरह समझ पाता है। Sarvam Vision ने इसमें कुल 93.28% स्कोर किया, जो बताता है कि यह टूल उन जगहों पर भी बेहतर काम करता है, जहां पुराने OCR सिस्टम अक्सर फेल हो जाते हैं। इस प्रदर्शन के बाद Sarvam AI को लेकर पहले की शंकाएं अब तारीफ में बदल रही हैं। टेक कमेंटेटर Deedy Das ने भी माना कि उन्होंने Sarvam को पहले कम आंका था और अब यह भारतीय भाषाओं के लिए एक बहुत बड़ी कमी को पूरा कर रहा है।

Sarvam AI ने अपना नया Text-To-Speech मॉडल भी किया लॉन्च

OCR के अलावा Sarvam AI ने अपना नया Text-To-Speech मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक, भावनात्मक और स्थिर आवाज तैयार करने में सक्षम है। Bulbul V3 फिलहाल 11 भारतीय भाषाओं में 35 से ज्यादा आवाजों को सपोर्ट करता है और आगे चलकर 22 भाषाओं तक विस्तार की योजना है, कई यूजर्स और स्टार्टअप्स ने इसकी तारीफ की है। KissanAI के फाउंडर प्रतीक देसाई ने कहा कि Indic भाषाओं के लिए Bulbul उनका पसंदीदा TTS मॉडल बन चुका है और इसकी कीमत भी विदेशी टूल्स जैसे ElevenLabs के मुकाबले ज्यादा समझदारी भरी है।

