comscore

भारत के Sarvam AI ने Google Gemini और ChatGPT को दी चुनौती, बेंचमार्क टेस्ट में छोड़ा पीछे

भारत का स्टार्टअप Sarvam AI अब दुनिया के बड़े AI मॉडल्स को टक्कर दे रहा है। उन्होंने अपना नया OCR टूल Sarvam Vision और Text-To-Speech मॉडल Bulbul V3 लॉन्च किया है। ये टूल्स भारतीय भाषाओं में डॉक्यूमेंट और आवाज को समझने और बोलने में Google Gemini और ChatGPT से भी बेहतर साबित हुए हैं। आइए जानते हैं...

Edited By: Ashutosh Ojha | Published By: Ashutosh Ojha | Published: Feb 09, 2026, 03:40 PM (IST)

  • whatsapp
  • twitter
  • facebook
  • whatsapp
  • twitter
  • facebook

news और पढें: भारत में ChatGPT Go एक साल के लिए फ्री, 4 नवंबर से मिलेगा फायदा

भारत अब सिर्फ AI का Consumer नहीं, बल्कि उसे बनाने वाला देश भी बनता जा रहा है। बेंगलुरु स्थित स्टार्टअप Sarvam AI ने यह साबित कर दिया है कि भारत भी वर्ल्ड-क्लास आर्टिफिशियल इंटेलिजेंस मॉडल बना सकता है, खासकर भारत से जुड़ी जरूरतों के लिए। कंपनी ने हाल ही में अपना नया OCR Tools Sarvam Vision लॉन्च किया है, जिसने भारतीय भाषाओं में डॉक्यूमेंट पढ़ने और समझने के मामले में Google Gemini, ChatGPT और Anthropic Claude जैसे बड़े AI मॉडल्स को पीछे छोड़ दिया है। इसके साथ ही Sarvam का AI वॉयस मॉडल Bulbul V3 भी काफी चर्चा में है, जो भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज तैयार करता है।

Sarvam Vision ने बड़े AI मॉडल्स को पीछे छोड़ा

अब तक AI की दुनिया में अमेरिका और चीन का दबदबा माना जाता था। भारत के पास टैलेंट और स्केल होने के बावजूद, उसे कोर AI डेवलपमेंट का लीडर नहीं माना जाता था लेकिन Sarvam AI इस सोच को बदल रहा है। कंपनी खुद को Sovereign AI’ बनाने वाली संस्था बताती है यानी ऐसा AI जो भारत में बना हो और भारत की जरूरतों पर केंद्रित हो। Sarvam AI के को-फाउंडर प्रत्युष कुमार ने सोशल मीडिया प्लेटफॉर्म X पर बताया कि Sarvam Vision ने olmOCR-Bench में 84.3% की सटीकता हासिल की है, जो Gemini 3 Pro और DeepSeek OCR v2 जैसे टूल्स से बेहतर है, जबकि ChatGPT का स्कोर काफी कम रहा।

Sarvam Vision ने बेंचमार्क टेस्ट में कैसा प्रदर्शन किया

इतना ही नहीं Sarvam Vision ने OmniDocBench v1.5 जैसे कठिन बेंचमार्क पर भी शानदार प्रदर्शन किया है। इस टेस्ट में यह देखा जाता है कि AI असली दुनिया के मुश्किल डॉक्यूमेंट जैसे Technical table, Mathematical फॉर्मूले और उलझे हुए लेआउट को कितनी अच्छी तरह समझ पाता है। Sarvam Vision ने इसमें कुल 93.28% स्कोर किया, जो बताता है कि यह टूल उन जगहों पर भी बेहतर काम करता है, जहां पुराने OCR सिस्टम अक्सर फेल हो जाते हैं। इस प्रदर्शन के बाद Sarvam AI को लेकर पहले की शंकाएं अब तारीफ में बदल रही हैं। टेक कमेंटेटर Deedy Das ने भी माना कि उन्होंने Sarvam को पहले कम आंका था और अब यह भारतीय भाषाओं के लिए एक बहुत बड़ी कमी को पूरा कर रहा है।

Sarvam AI ने अपना नया Text-To-Speech मॉडल भी किया लॉन्च

OCR के अलावा Sarvam AI ने अपना नया Text-To-Speech मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक, भावनात्मक और स्थिर आवाज तैयार करने में सक्षम है। Bulbul V3 फिलहाल 11 भारतीय भाषाओं में 35 से ज्यादा आवाजों को सपोर्ट करता है और आगे चलकर 22 भाषाओं तक विस्तार की योजना है, कई यूजर्स और स्टार्टअप्स ने इसकी तारीफ की है। KissanAI के फाउंडर प्रतीक देसाई ने कहा कि Indic भाषाओं के लिए Bulbul उनका पसंदीदा TTS मॉडल बन चुका है और इसकी कीमत भी विदेशी टूल्स जैसे ElevenLabs के मुकाबले ज्यादा समझदारी भरी है।

Add Techlusive as a Preferred SourceAddTechlusiveasaPreferredSource