Written By Ajay Verma
Published By: Ajay Verma | Published: Dec 29, 2023, 05:49 PM (IST)
Google ने Dall-E 3 जैसे मॉडल को कड़ी टक्कर देने के लिए नया लार्ज लैंग्वेज मॉडल (LLM) को पेश किया है। इस मल्टीमॉडल का नाम ‘VideoPoet’ रखा गया है। यह वीडियो जनरेशन कैपेब्लिटी के साथ आता है। साधारण शब्दों में कहें तो गूगल का नया मॉडल वीडियो जनरेट करने सक्षम है। बता दें कि दिग्गज टेक कंपनी गूगल ने इस महीने की शुरुआत में एआई मॉडल Gemini को पेश किया था। और पढें: Google के CEO ने ChatGPT को लेकर कही बड़ी बात, खुलकर AI के बारे में क्या बोले सुंदर पिचाई
गूगल का कहना है कि VideoPoet मल्टीमॉडल है, क्योंकि यह टेक्स्ट, इमेज, ऑडियो से वीडियो तैयार करता है। इसमें ‘डिकोडर-ओनली आर्किटेक्चर’ का इस्तेमाल किया गया है, जो इसे उन कार्यों के लिए कंटेंट तैयार करने मदद करता है, जिनकी इसे किसी तरह की ट्रेनिंग नहीं मिली है। और पढें: Google One का दिवाली गिफ्ट, मात्र 11 रुपये में पाएं 2TB तक की क्लाउड स्टोरेज फ्री, जानें ऑफर
इस मॉडल में प्रीट्रेनिंग और टेस्क-स्पेसिफिक एडेप्टेशन मॉडल्स को शामिल किया गया है। रिसर्चर्स का मानना है कि इसमें उपयोग होने वाले प्री-ट्रेन्ड एलएलएम मॉडल इसका बेस फ्रेमवर्क है, जिससे अलग-अलग प्रकार की वीडियो बनाई जा सकती है। और पढें: अंडमान और निकोबार आइलैंड बनेगा ग्लोबल इंटरनेट हब, अश्विनी वैष्णव ने किया बड़ा ऐलान
गूगल का नया मॉडल वीडियोपॉएट छोटी-छोटी वीडियो क्लिप्स को जोड़कर शॉर्ट फिल्म बनाता है। यह मॉडल क्रिएटेड वीडियो को कस्टामाइज भी करता है। हालांकि, इसके जरिए लॉन्ग टर्म वीडियो नहीं बनाई जा सकती है।
इस मॉडल को अभी तक आम यूजर्स के लिए रिलीज नहीं किया गया है। इसकी टेस्टिंग चल रही है। उम्मीद है कि इसे नए साल की शुरुआत में लॉन्च कर दिया जाएगा।
Gemini 1.0. मॉडल को इस महीने लॉन्च किया गया था। यह मॉडल फोटो से लेकर कोड और ऑडियो तक बना सकते हैं। इस मॉडल को इस तरह डिजाइन किया गया है कि यह अलग-अलग सिस्टम पर भरोसा किए बिना विभिन्न प्रकार की सूचनाओं को मिलाकर बेहतर तरीके से तैयार करता है।
कंपनी का मानना है कि जेमिनी 1.0 अब तक के सबसे बेस्ट मॉडल्स में से एक है। इसे साल 2024 में सभी स्टेबल यूजर्स के लिए लॉन्च किया जा सकता है। हालांकि, गूगल ने अभी तक इसकी स्टेबल लॉन्चिंग को लेकर किसी प्रकार की जानकारी नहीं दी है।