Written By Ajay Verma
Published By: Ajay Verma | Published: Dec 29, 2023, 05:49 PM (IST)
Google ने Dall-E 3 जैसे मॉडल को कड़ी टक्कर देने के लिए नया लार्ज लैंग्वेज मॉडल (LLM) को पेश किया है। इस मल्टीमॉडल का नाम ‘VideoPoet’ रखा गया है। यह वीडियो जनरेशन कैपेब्लिटी के साथ आता है। साधारण शब्दों में कहें तो गूगल का नया मॉडल वीडियो जनरेट करने सक्षम है। बता दें कि दिग्गज टेक कंपनी गूगल ने इस महीने की शुरुआत में एआई मॉडल Gemini को पेश किया था। और पढें: Google ने AI-Powered Laptop 'Googlebook' की दिखाई झलक, मिलेगा Android और Gemini AI का पावरफुल कॉम्बो
गूगल का कहना है कि VideoPoet मल्टीमॉडल है, क्योंकि यह टेक्स्ट, इमेज, ऑडियो से वीडियो तैयार करता है। इसमें ‘डिकोडर-ओनली आर्किटेक्चर’ का इस्तेमाल किया गया है, जो इसे उन कार्यों के लिए कंटेंट तैयार करने मदद करता है, जिनकी इसे किसी तरह की ट्रेनिंग नहीं मिली है। और पढें: Android 17 आते ही स्कैमर्स की छुट्टी! Google ने पेश किए खतरनाक सिक्योरिटी फीचर्स
इस मॉडल में प्रीट्रेनिंग और टेस्क-स्पेसिफिक एडेप्टेशन मॉडल्स को शामिल किया गया है। रिसर्चर्स का मानना है कि इसमें उपयोग होने वाले प्री-ट्रेन्ड एलएलएम मॉडल इसका बेस फ्रेमवर्क है, जिससे अलग-अलग प्रकार की वीडियो बनाई जा सकती है। और पढें: क्या Google सच में हुआ डाउन? कुछ लोगों को Search पर दिखा ‘Server Error’
गूगल का नया मॉडल वीडियोपॉएट छोटी-छोटी वीडियो क्लिप्स को जोड़कर शॉर्ट फिल्म बनाता है। यह मॉडल क्रिएटेड वीडियो को कस्टामाइज भी करता है। हालांकि, इसके जरिए लॉन्ग टर्म वीडियो नहीं बनाई जा सकती है।
इस मॉडल को अभी तक आम यूजर्स के लिए रिलीज नहीं किया गया है। इसकी टेस्टिंग चल रही है। उम्मीद है कि इसे नए साल की शुरुआत में लॉन्च कर दिया जाएगा।
Gemini 1.0. मॉडल को इस महीने लॉन्च किया गया था। यह मॉडल फोटो से लेकर कोड और ऑडियो तक बना सकते हैं। इस मॉडल को इस तरह डिजाइन किया गया है कि यह अलग-अलग सिस्टम पर भरोसा किए बिना विभिन्न प्रकार की सूचनाओं को मिलाकर बेहतर तरीके से तैयार करता है।
कंपनी का मानना है कि जेमिनी 1.0 अब तक के सबसे बेस्ट मॉडल्स में से एक है। इसे साल 2024 में सभी स्टेबल यूजर्स के लिए लॉन्च किया जा सकता है। हालांकि, गूगल ने अभी तक इसकी स्टेबल लॉन्चिंग को लेकर किसी प्रकार की जानकारी नहीं दी है।