Google ने लॉन्च किया नया Gemini 3.1 TTS, 70+ भाषाओं का मिलेगा सपोर्ट

Google ने Gemini 3.1 Flash TTS नाम का नया Text-to-Speech मॉडल लॉन्च किया है, जो टेक्स्ट को और ज्यादा नेचुरल आवाज में बदलता है। यह 70+ भाषाओं को सपोर्ट करता है और डेवलपर्स के लिए बनाया गया है। आइए जानते हैं...

Published By: Ashutosh Ojha | Published: Apr 16, 2026, 02:04 PM (IST)

Google Gemini 3.1 Flash TTS release: Developers get advanced voice control and multi-speaker support

techlusive.in Written By article news — Written By Ashutosh Ojha

Google ने अपनी नई AI टेक्नोलॉजी के तहत Gemini 3.1 Flash TTS नाम का एक नया Text-to-Speech (TTS) मॉडल लॉन्च किया है। यह मॉडल टेक्स्ट को आवाज में बदलने की टेक्नोलॉजी को पहले से कहीं ज्यादा बेहतर और नेचुरल बनाने के लिए डिजाइन किया गया है। कंपनी का कहना है कि इस नए सिस्टम में Audio Quality, Controls और Language Support पर खास ध्यान दिया गया है। यह टेक्नोलॉजी खासतौर पर डेवलपर्स और बिजनेस यूजर्स के लिए बनाई गई है, जो अपने ऐप्स और सर्विस में ज्यादा रियलिस्टिक AI आवाज जोड़ना चाहते हैं। यह मॉडल 70 से अधिक भाषाओं को सपोर्ट करता है।

Gemini 3.1 Flash TTS की सबसे खास बात

Gemini 3.1 Flash TTS की सबसे खास बात इसका बेहतर ‘Voice Control’ फीचर है। अब यूजर या डेवलपर केवल टेक्स्ट निर्देशों के जरिए आवाज के टोन, स्पीड और स्टाइल को बदल सकते हैं। इसका मतलब है कि AI सिर्फ टेक्स्ट पढ़ेगा ही नहीं, बल्कि उसे उसी अंदाज में बोलेगा जैसा निर्देश दिया गया है। इसके अलावा इसमें स्पेशल ऑडियो टैग्स का भी सपोर्ट दिया गया है, जिनकी मदद से आवाज में पॉज, जोर और बोलने के तरीके को और भी सटीक तरीके से नियंत्रित किया जा सकता है। इससे बिना किसी मुश्किल सेटिंग के नैचुरल और इंसानी जैसी आवाज तैयार करना आसान हो जाता है।

इस नए मॉडल मिलेगा मल्टी-स्पीकर सपोर्ट

इस नए मॉडल में मल्टी-स्पीकर सपोर्ट भी जोड़ा गया है, जो इसे और भी एडवांस बनाता है। इस फीचर की मदद से एक ही सिस्टम में अलग-अलग आवाजों के साथ बातचीत या डायलॉग तैयार किए जा सकते हैं। हर आवाज की अपनी अलग पहचान और स्टाइल हो सकती है, जिससे यह कहानी सुनाने, कस्टमर सपोर्ट सिस्टम और कंटेंट क्रिएशन के लिए बेहद यूजफुल बन जाता है, साथ ही इसकी ऑडियो क्वालिटी को भी काफी बेहतर किया गया है, ताकि आवाज ज्यादा साफ, स्मूद और इंसानी बोलचाल जैसी लगे।

Add Techlusive as a Preferred Source

सुरक्षा के लिए खास टेक्नोलॉजी

सुरक्षा को ध्यान में रखते हुए गूगल ने इसमें SynthID नाम की टेक्नोलॉजी भी शामिल की है। यह सिस्टम AI द्वारा बनाई गई आवाजों में एक इनविजिबल वॉटरमार्क जोड़ता है, जिससे यह पता लगाया जा सकता है कि ऑडियो AI जनरेटेड है, फिलहाल Gemini 3.1 Flash TTS को प्रीव्यू मोड में लॉन्च किया गया है और इसे Google AI Studio, Gemini API के जरिए डेवलपर्स इस्तेमाल कर सकते हैं, वहीं बिजनेस यूजर्स इसे Vertex AI प्लेटफॉर्म पर एक्सेस कर सकते हैं। कंपनी का कहना है कि फीडबैक के आधार पर सुधार करने के बाद इसे जल्द ही वैश्विक स्तर पर सभी यूजर्स के लिए लॉन्च किया जाएगा।