Google ने लॉन्च किया नया Gemini 3.1 TTS, 70+ भाषाओं का मिलेगा सपोर्ट

Google ने Gemini 3.1 Flash TTS नाम का नया Text-to-Speech मॉडल लॉन्च किया है, जो टेक्स्ट को और ज्यादा नेचुरल आवाज में बदलता है। यह 70+ भाषाओं को सपोर्ट करता है और डेवलपर्स के लिए बनाया गया है। आइए जानते हैं...

Published By: Ashutosh Ojha | Published: Apr 16, 2026, 02:04 PM (IST)

Google Gemini 3.1 Flash TTS release: Developers get advanced voice control and multi-speaker support

Google ने अपनी नई AI टेक्नोलॉजी के तहत Gemini 3.1 Flash TTS नाम का एक नया Text-to-Speech (TTS) मॉडल लॉन्च किया है। यह मॉडल टेक्स्ट को आवाज में बदलने की टेक्नोलॉजी को पहले से कहीं ज्यादा बेहतर और नेचुरल बनाने के लिए डिजाइन किया गया है। कंपनी का कहना है कि इस नए सिस्टम में Audio Quality, Controls और Language Support पर खास ध्यान दिया गया है। यह टेक्नोलॉजी खासतौर पर डेवलपर्स और बिजनेस यूजर्स के लिए बनाई गई है, जो अपने ऐप्स और सर्विस में ज्यादा रियलिस्टिक AI आवाज जोड़ना चाहते हैं। यह मॉडल 70 से अधिक भाषाओं को सपोर्ट करता है।

Gemini 3.1 Flash TTS की सबसे खास बात

Gemini 3.1 Flash TTS की सबसे खास बात इसका बेहतर 'Voice Control' फीचर है। अब यूजर या डेवलपर केवल टेक्स्ट निर्देशों के जरिए आवाज के टोन, स्पीड और स्टाइल को बदल सकते हैं। इसका मतलब है कि AI सिर्फ टेक्स्ट पढ़ेगा ही नहीं, बल्कि उसे उसी अंदाज में बोलेगा जैसा निर्देश दिया गया है। इसके अलावा इसमें स्पेशल ऑडियो टैग्स का भी सपोर्ट दिया गया है, जिनकी मदद से आवाज में पॉज, जोर और बोलने के तरीके को और भी सटीक तरीके से नियंत्रित किया जा सकता है। इससे बिना किसी मुश्किल सेटिंग के नैचुरल और इंसानी जैसी आवाज तैयार करना आसान हो जाता है।

इस नए मॉडल मिलेगा मल्टी-स्पीकर सपोर्ट

इस नए मॉडल में मल्टी-स्पीकर सपोर्ट भी जोड़ा गया है, जो इसे और भी एडवांस बनाता है। इस फीचर की मदद से एक ही सिस्टम में अलग-अलग आवाजों के साथ बातचीत या डायलॉग तैयार किए जा सकते हैं। हर आवाज की अपनी अलग पहचान और स्टाइल हो सकती है, जिससे यह कहानी सुनाने, कस्टमर सपोर्ट सिस्टम और कंटेंट क्रिएशन के लिए बेहद यूजफुल बन जाता है, साथ ही इसकी ऑडियो क्वालिटी को भी काफी बेहतर किया गया है, ताकि आवाज ज्यादा साफ, स्मूद और इंसानी बोलचाल जैसी लगे।

सुरक्षा के लिए खास टेक्नोलॉजी

सुरक्षा को ध्यान में रखते हुए गूगल ने इसमें SynthID नाम की टेक्नोलॉजी भी शामिल की है। यह सिस्टम AI द्वारा बनाई गई आवाजों में एक इनविजिबल वॉटरमार्क जोड़ता है, जिससे यह पता लगाया जा सकता है कि ऑडियो AI जनरेटेड है, फिलहाल Gemini 3.1 Flash TTS को प्रीव्यू मोड में लॉन्च किया गया है और इसे Google AI Studio, Gemini API के जरिए डेवलपर्स इस्तेमाल कर सकते हैं, वहीं बिजनेस यूजर्स इसे Vertex AI प्लेटफॉर्म पर एक्सेस कर सकते हैं। कंपनी का कहना है कि फीडबैक के आधार पर सुधार करने के बाद इसे जल्द ही वैश्विक स्तर पर सभी यूजर्स के लिए लॉन्च किया जाएगा।

टेक्नोलॉजी और ऑटोमोबाइल की लेटेस्ट खबरों के लिए आप हमें व्हाट्सऐप चैनल, फेसबुक, यूट्यूब और X, पर फॉलो करें।

Follow Us on

Google ने लॉन्च किया नया Gemini 3.1 TTS, 70+ भाषाओं का मिलेगा सपोर्ट

Gemini 3.1 Flash TTS की सबसे खास बात

इस नए मॉडल मिलेगा मल्टी-स्पीकर सपोर्ट

सुरक्षा के लिए खास टेक्नोलॉजी