Google ने लॉन्च किया नया Gemini 3.1 TTS, 70+ भाषाओं का मिलेगा सपोर्ट
Google ने Gemini 3.1 Flash TTS नाम का नया Text-to-Speech मॉडल लॉन्च किया है, जो टेक्स्ट को और ज्यादा नेचुरल आवाज में बदलता है। यह 70+ भाषाओं को सपोर्ट करता है और डेवलपर्स के लिए बनाया गया है। आइए जानते हैं...
Published By: Ashutosh Ojha | Published: Apr 16, 2026, 02:04 PM (IST)
Google ने अपनी नई AI टेक्नोलॉजी के तहत Gemini 3.1 Flash TTS नाम का एक नया Text-to-Speech (TTS) मॉडल लॉन्च किया है। यह मॉडल टेक्स्ट को आवाज में बदलने की टेक्नोलॉजी को पहले से कहीं ज्यादा बेहतर और नेचुरल बनाने के लिए डिजाइन किया गया है। कंपनी का कहना है कि इस नए सिस्टम में Audio Quality, Controls और Language Support पर खास ध्यान दिया गया है। यह टेक्नोलॉजी खासतौर पर डेवलपर्स और बिजनेस यूजर्स के लिए बनाई गई है, जो अपने ऐप्स और सर्विस में ज्यादा रियलिस्टिक AI आवाज जोड़ना चाहते हैं। यह मॉडल 70 से अधिक भाषाओं को सपोर्ट करता है।
Gemini 3.1 Flash TTS की सबसे खास बात
Gemini 3.1 Flash TTS की सबसे खास बात इसका बेहतर 'Voice Control' फीचर है। अब यूजर या डेवलपर केवल टेक्स्ट निर्देशों के जरिए आवाज के टोन, स्पीड और स्टाइल को बदल सकते हैं। इसका मतलब है कि AI सिर्फ टेक्स्ट पढ़ेगा ही नहीं, बल्कि उसे उसी अंदाज में बोलेगा जैसा निर्देश दिया गया है। इसके अलावा इसमें स्पेशल ऑडियो टैग्स का भी सपोर्ट दिया गया है, जिनकी मदद से आवाज में पॉज, जोर और बोलने के तरीके को और भी सटीक तरीके से नियंत्रित किया जा सकता है। इससे बिना किसी मुश्किल सेटिंग के नैचुरल और इंसानी जैसी आवाज तैयार करना आसान हो जाता है।
इस नए मॉडल मिलेगा मल्टी-स्पीकर सपोर्ट
इस नए मॉडल में मल्टी-स्पीकर सपोर्ट भी जोड़ा गया है, जो इसे और भी एडवांस बनाता है। इस फीचर की मदद से एक ही सिस्टम में अलग-अलग आवाजों के साथ बातचीत या डायलॉग तैयार किए जा सकते हैं। हर आवाज की अपनी अलग पहचान और स्टाइल हो सकती है, जिससे यह कहानी सुनाने, कस्टमर सपोर्ट सिस्टम और कंटेंट क्रिएशन के लिए बेहद यूजफुल बन जाता है, साथ ही इसकी ऑडियो क्वालिटी को भी काफी बेहतर किया गया है, ताकि आवाज ज्यादा साफ, स्मूद और इंसानी बोलचाल जैसी लगे।
सुरक्षा के लिए खास टेक्नोलॉजी
सुरक्षा को ध्यान में रखते हुए गूगल ने इसमें SynthID नाम की टेक्नोलॉजी भी शामिल की है। यह सिस्टम AI द्वारा बनाई गई आवाजों में एक इनविजिबल वॉटरमार्क जोड़ता है, जिससे यह पता लगाया जा सकता है कि ऑडियो AI जनरेटेड है, फिलहाल Gemini 3.1 Flash TTS को प्रीव्यू मोड में लॉन्च किया गया है और इसे Google AI Studio, Gemini API के जरिए डेवलपर्स इस्तेमाल कर सकते हैं, वहीं बिजनेस यूजर्स इसे Vertex AI प्लेटफॉर्म पर एक्सेस कर सकते हैं। कंपनी का कहना है कि फीडबैक के आधार पर सुधार करने के बाद इसे जल्द ही वैश्विक स्तर पर सभी यूजर्स के लिए लॉन्च किया जाएगा।
टेक्नोलॉजी और ऑटोमोबाइल की लेटेस्ट खबरों के लिए आप हमें व्हाट्सऐप चैनल, फेसबुक, यूट्यूब और X, पर फॉलो करें।