Written By Ajay Verma
Published By: Ajay Verma | Published: Dec 29, 2023, 05:49 PM (IST)
Google ने Dall-E 3 जैसे मॉडल को कड़ी टक्कर देने के लिए नया लार्ज लैंग्वेज मॉडल (LLM) को पेश किया है। इस मल्टीमॉडल का नाम ‘VideoPoet’ रखा गया है। यह वीडियो जनरेशन कैपेब्लिटी के साथ आता है। साधारण शब्दों में कहें तो गूगल का नया मॉडल वीडियो जनरेट करने सक्षम है। बता दें कि दिग्गज टेक कंपनी गूगल ने इस महीने की शुरुआत में एआई मॉडल Gemini को पेश किया था। और पढें: Samsung से iPhone में फोटो व वीडियो कर सकेंगे AirDrop, Samsung Galaxy S26 सीरीज यूजर्स की मौज
गूगल का कहना है कि VideoPoet मल्टीमॉडल है, क्योंकि यह टेक्स्ट, इमेज, ऑडियो से वीडियो तैयार करता है। इसमें ‘डिकोडर-ओनली आर्किटेक्चर’ का इस्तेमाल किया गया है, जो इसे उन कार्यों के लिए कंटेंट तैयार करने मदद करता है, जिनकी इसे किसी तरह की ट्रेनिंग नहीं मिली है। और पढें: Microsoft ने लॉन्च किया MAI-Image-2 का सेकंड जनरेशन मॉडल, जानिए क्या है इसमें खास
इस मॉडल में प्रीट्रेनिंग और टेस्क-स्पेसिफिक एडेप्टेशन मॉडल्स को शामिल किया गया है। रिसर्चर्स का मानना है कि इसमें उपयोग होने वाले प्री-ट्रेन्ड एलएलएम मॉडल इसका बेस फ्रेमवर्क है, जिससे अलग-अलग प्रकार की वीडियो बनाई जा सकती है। और पढें: Play Store के बाहर App इंस्टॉल करना होगा मुश्किल, Google ने Android फोन के लिए नए नियम का किया ऐलान
गूगल का नया मॉडल वीडियोपॉएट छोटी-छोटी वीडियो क्लिप्स को जोड़कर शॉर्ट फिल्म बनाता है। यह मॉडल क्रिएटेड वीडियो को कस्टामाइज भी करता है। हालांकि, इसके जरिए लॉन्ग टर्म वीडियो नहीं बनाई जा सकती है।
इस मॉडल को अभी तक आम यूजर्स के लिए रिलीज नहीं किया गया है। इसकी टेस्टिंग चल रही है। उम्मीद है कि इसे नए साल की शुरुआत में लॉन्च कर दिया जाएगा।
Gemini 1.0. मॉडल को इस महीने लॉन्च किया गया था। यह मॉडल फोटो से लेकर कोड और ऑडियो तक बना सकते हैं। इस मॉडल को इस तरह डिजाइन किया गया है कि यह अलग-अलग सिस्टम पर भरोसा किए बिना विभिन्न प्रकार की सूचनाओं को मिलाकर बेहतर तरीके से तैयार करता है।
कंपनी का मानना है कि जेमिनी 1.0 अब तक के सबसे बेस्ट मॉडल्स में से एक है। इसे साल 2024 में सभी स्टेबल यूजर्स के लिए लॉन्च किया जा सकता है। हालांकि, गूगल ने अभी तक इसकी स्टेबल लॉन्चिंग को लेकर किसी प्रकार की जानकारी नहीं दी है।