भारत के Sarvam AI ने Google Gemini और ChatGPT को दी चुनौती, बेंचमार्क टेस्ट में छोड़ा पीछे

भारत का स्टार्टअप Sarvam AI अब दुनिया के बड़े AI मॉडल्स को टक्कर दे रहा है। उन्होंने अपना नया OCR टूल Sarvam Vision और Text-To-Speech मॉडल Bulbul V3 लॉन्च किया है। ये टूल्स भारतीय भाषाओं में डॉक्यूमेंट और आवाज को समझने और बोलने में Google Gemini और ChatGPT से भी बेहतर साबित हुए हैं। आइए जानते हैं...

Published By: Ashutosh Ojha | Published: Feb 09, 2026, 03:40 PM (IST) | Edited: Feb 09, 2026, 03:44 PM (IST)

और पढें: WION World Pulse: AI नहीं छीनेगा नौकरी पर... IndiaAI Mission के CEO ने कही ये बड़ी बात

भारत अब सिर्फ AI का Consumer नहीं, बल्कि उसे बनाने वाला देश भी बनता जा रहा है। बेंगलुरु स्थित स्टार्टअप Sarvam AI ने यह साबित कर दिया है कि भारत भी वर्ल्ड-क्लास आर्टिफिशियल इंटेलिजेंस मॉडल बना सकता है, खासकर भारत से जुड़ी जरूरतों के लिए। कंपनी ने हाल ही में अपना नया OCR Tools Sarvam Vision लॉन्च किया है, जिसने भारतीय भाषाओं में डॉक्यूमेंट पढ़ने और समझने के मामले में Google Gemini, ChatGPT और Anthropic Claude जैसे बड़े AI मॉडल्स को पीछे छोड़ दिया है। इसके साथ ही Sarvam का AI वॉयस मॉडल Bulbul V3 भी काफी चर्चा में है, जो भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज तैयार करता है। और पढें: India AI Impact Summit 2026: Sarvam AI और HMD Global ने मिलाया हाथ, Nokia के फीचर फोन में मिलेगी 'AI Chat' सुविधा

Sarvam Vision ने बड़े AI मॉडल्स को पीछे छोड़ा

अब तक AI की दुनिया में अमेरिका और चीन का दबदबा माना जाता था। भारत के पास टैलेंट और स्केल होने के बावजूद, उसे कोर AI डेवलपमेंट का लीडर नहीं माना जाता था लेकिन Sarvam AI इस सोच को बदल रहा है। कंपनी खुद को 'Sovereign AI' बनाने वाली संस्था बताती है यानी ऐसा AI जो भारत में बना हो और भारत की जरूरतों पर केंद्रित हो। Sarvam AI के को-फाउंडर प्रत्युष कुमार ने सोशल मीडिया प्लेटफॉर्म X पर बताया कि Sarvam Vision ने olmOCR-Bench में 84.3% की सटीकता हासिल की है, जो Gemini 3 Pro और DeepSeek OCR v2 जैसे टूल्स से बेहतर है, जबकि ChatGPT का स्कोर काफी कम रहा। और पढें: Sarvam ने लॉन्च किया Sarvam Akshar, अब इस AI से डॉक्यूमेंट पढ़ना और सही करना हुआ आसान

Sarvam Vision ने बेंचमार्क टेस्ट में कैसा प्रदर्शन किया

इतना ही नहीं Sarvam Vision ने OmniDocBench v1.5 जैसे कठिन बेंचमार्क पर भी शानदार प्रदर्शन किया है। इस टेस्ट में यह देखा जाता है कि AI असली दुनिया के मुश्किल डॉक्यूमेंट जैसे Technical table, Mathematical फॉर्मूले और उलझे हुए लेआउट को कितनी अच्छी तरह समझ पाता है। Sarvam Vision ने इसमें कुल 93.28% स्कोर किया, जो बताता है कि यह टूल उन जगहों पर भी बेहतर काम करता है, जहां पुराने OCR सिस्टम अक्सर फेल हो जाते हैं। इस प्रदर्शन के बाद Sarvam AI को लेकर पहले की शंकाएं अब तारीफ में बदल रही हैं। टेक कमेंटेटर Deedy Das ने भी माना कि उन्होंने Sarvam को पहले कम आंका था और अब यह भारतीय भाषाओं के लिए एक बहुत बड़ी कमी को पूरा कर रहा है।

Sarvam AI ने अपना नया Text-To-Speech मॉडल भी किया लॉन्च

OCR के अलावा Sarvam AI ने अपना नया Text-To-Speech मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक, भावनात्मक और स्थिर आवाज तैयार करने में सक्षम है। Bulbul V3 फिलहाल 11 भारतीय भाषाओं में 35 से ज्यादा आवाजों को सपोर्ट करता है और आगे चलकर 22 भाषाओं तक विस्तार की योजना है, कई यूजर्स और स्टार्टअप्स ने इसकी तारीफ की है। KissanAI के फाउंडर प्रतीक देसाई ने कहा कि Indic भाषाओं के लिए Bulbul उनका पसंदीदा TTS मॉडल बन चुका है और इसकी कीमत भी विदेशी टूल्स जैसे ElevenLabs के मुकाबले ज्यादा समझदारी भरी है।

टेक्नोलॉजी और ऑटोमोबाइल की लेटेस्ट खबरों के लिए आप हमें व्हाट्सऐप चैनल, फेसबुक, यूट्यूब और X, पर फॉलो करें।