Written By Ajay Verma
Published By: Ajay Verma | Published: Dec 29, 2023, 05:49 PM (IST)
Google ने Dall-E 3 जैसे मॉडल को कड़ी टक्कर देने के लिए नया लार्ज लैंग्वेज मॉडल (LLM) को पेश किया है। इस मल्टीमॉडल का नाम ‘VideoPoet’ रखा गया है। यह वीडियो जनरेशन कैपेब्लिटी के साथ आता है। साधारण शब्दों में कहें तो गूगल का नया मॉडल वीडियो जनरेट करने सक्षम है। बता दें कि दिग्गज टेक कंपनी गूगल ने इस महीने की शुरुआत में एआई मॉडल Gemini को पेश किया था। और पढें: Sony Bravia 4K TV's पर मिल रहा तगड़ा डिस्काउंट, Amazon दे रहा ढेर सारे ऑफर्स
गूगल का कहना है कि VideoPoet मल्टीमॉडल है, क्योंकि यह टेक्स्ट, इमेज, ऑडियो से वीडियो तैयार करता है। इसमें ‘डिकोडर-ओनली आर्किटेक्चर’ का इस्तेमाल किया गया है, जो इसे उन कार्यों के लिए कंटेंट तैयार करने मदद करता है, जिनकी इसे किसी तरह की ट्रेनिंग नहीं मिली है। और पढें: Year Ender 2025: साल 2025 में लॉन्च हुए ये Top-5 बेस्ट कैमरा स्मार्टफोन, रिजल्ट मिलेगा DSLR जैसा
इस मॉडल में प्रीट्रेनिंग और टेस्क-स्पेसिफिक एडेप्टेशन मॉडल्स को शामिल किया गया है। रिसर्चर्स का मानना है कि इसमें उपयोग होने वाले प्री-ट्रेन्ड एलएलएम मॉडल इसका बेस फ्रेमवर्क है, जिससे अलग-अलग प्रकार की वीडियो बनाई जा सकती है। और पढें: YouTube ने TV App के लिए नया इंटरफेस किया लॉन्च, जानें क्या हैं बड़े बदलाव
गूगल का नया मॉडल वीडियोपॉएट छोटी-छोटी वीडियो क्लिप्स को जोड़कर शॉर्ट फिल्म बनाता है। यह मॉडल क्रिएटेड वीडियो को कस्टामाइज भी करता है। हालांकि, इसके जरिए लॉन्ग टर्म वीडियो नहीं बनाई जा सकती है।
इस मॉडल को अभी तक आम यूजर्स के लिए रिलीज नहीं किया गया है। इसकी टेस्टिंग चल रही है। उम्मीद है कि इसे नए साल की शुरुआत में लॉन्च कर दिया जाएगा।
Gemini 1.0. मॉडल को इस महीने लॉन्च किया गया था। यह मॉडल फोटो से लेकर कोड और ऑडियो तक बना सकते हैं। इस मॉडल को इस तरह डिजाइन किया गया है कि यह अलग-अलग सिस्टम पर भरोसा किए बिना विभिन्न प्रकार की सूचनाओं को मिलाकर बेहतर तरीके से तैयार करता है।
कंपनी का मानना है कि जेमिनी 1.0 अब तक के सबसे बेस्ट मॉडल्स में से एक है। इसे साल 2024 में सभी स्टेबल यूजर्स के लिए लॉन्च किया जा सकता है। हालांकि, गूगल ने अभी तक इसकी स्टेबल लॉन्चिंग को लेकर किसी प्रकार की जानकारी नहीं दी है।