comscore

Google ने लॉन्च किया नया Gemini 3.1 TTS, 70+ भाषाओं का मिलेगा सपोर्ट

Google ने Gemini 3.1 Flash TTS नाम का नया Text-to-Speech मॉडल लॉन्च किया है, जो टेक्स्ट को और ज्यादा नेचुरल आवाज में बदलता है। यह 70+ भाषाओं को सपोर्ट करता है और डेवलपर्स के लिए बनाया गया है। आइए जानते हैं...

Published By: Ashutosh Ojha | Published: Apr 16, 2026, 02:04 PM (IST)

  • whatsapp
  • twitter
  • facebook
  • whatsapp
  • twitter
  • facebook

Google ने अपनी नई AI टेक्नोलॉजी के तहत Gemini 3.1 Flash TTS नाम का एक नया Text-to-Speech (TTS) मॉडल लॉन्च किया है। यह मॉडल टेक्स्ट को आवाज में बदलने की टेक्नोलॉजी को पहले से कहीं ज्यादा बेहतर और नेचुरल बनाने के लिए डिजाइन किया गया है। कंपनी का कहना है कि इस नए सिस्टम में Audio Quality, Controls और Language Support पर खास ध्यान दिया गया है। यह टेक्नोलॉजी खासतौर पर डेवलपर्स और बिजनेस यूजर्स के लिए बनाई गई है, जो अपने ऐप्स और सर्विस में ज्यादा रियलिस्टिक AI आवाज जोड़ना चाहते हैं। यह मॉडल 70 से अधिक भाषाओं को सपोर्ट करता है।

Gemini 3.1 Flash TTS की सबसे खास बात

Gemini 3.1 Flash TTS की सबसे खास बात इसका बेहतर ‘Voice Control’ फीचर है। अब यूजर या डेवलपर केवल टेक्स्ट निर्देशों के जरिए आवाज के टोन, स्पीड और स्टाइल को बदल सकते हैं। इसका मतलब है कि AI सिर्फ टेक्स्ट पढ़ेगा ही नहीं, बल्कि उसे उसी अंदाज में बोलेगा जैसा निर्देश दिया गया है। इसके अलावा इसमें स्पेशल ऑडियो टैग्स का भी सपोर्ट दिया गया है, जिनकी मदद से आवाज में पॉज, जोर और बोलने के तरीके को और भी सटीक तरीके से नियंत्रित किया जा सकता है। इससे बिना किसी मुश्किल सेटिंग के नैचुरल और इंसानी जैसी आवाज तैयार करना आसान हो जाता है।

इस नए मॉडल मिलेगा मल्टी-स्पीकर सपोर्ट

इस नए मॉडल में मल्टी-स्पीकर सपोर्ट भी जोड़ा गया है, जो इसे और भी एडवांस बनाता है। इस फीचर की मदद से एक ही सिस्टम में अलग-अलग आवाजों के साथ बातचीत या डायलॉग तैयार किए जा सकते हैं। हर आवाज की अपनी अलग पहचान और स्टाइल हो सकती है, जिससे यह कहानी सुनाने, कस्टमर सपोर्ट सिस्टम और कंटेंट क्रिएशन के लिए बेहद यूजफुल बन जाता है, साथ ही इसकी ऑडियो क्वालिटी को भी काफी बेहतर किया गया है, ताकि आवाज ज्यादा साफ, स्मूद और इंसानी बोलचाल जैसी लगे।

Add Techlusive as a Preferred SourceAddTechlusiveasaPreferredSource

सुरक्षा के लिए खास टेक्नोलॉजी

सुरक्षा को ध्यान में रखते हुए गूगल ने इसमें SynthID नाम की टेक्नोलॉजी भी शामिल की है। यह सिस्टम AI द्वारा बनाई गई आवाजों में एक इनविजिबल वॉटरमार्क जोड़ता है, जिससे यह पता लगाया जा सकता है कि ऑडियो AI जनरेटेड है, फिलहाल Gemini 3.1 Flash TTS को प्रीव्यू मोड में लॉन्च किया गया है और इसे Google AI Studio, Gemini API के जरिए डेवलपर्स इस्तेमाल कर सकते हैं, वहीं बिजनेस यूजर्स इसे Vertex AI प्लेटफॉर्म पर एक्सेस कर सकते हैं। कंपनी का कहना है कि फीडबैक के आधार पर सुधार करने के बाद इसे जल्द ही वैश्विक स्तर पर सभी यूजर्स के लिए लॉन्च किया जाएगा।