ओपनएआई आखिरकार सोमवार को अपना कृत्रिम बुद्धिमत्ता (एआई) वीडियो जेनरेशन मॉडल सोरा लॉन्च कर दिया। फरवरी में, कंपनी ने चुनिंदा व्यक्तियों के लिए सोरा का पूर्वावलोकन किया, और अब, उसने सोरा टर्बो नामक मॉडल का एक अलग संस्करण जारी किया। सोरा 1080p रिज़ॉल्यूशन में वीडियो तैयार कर सकता है जो 20 सेकंड तक लंबा हो सकता है। एआई मॉडल को एक स्टैंडअलोन प्लेटफॉर्म पर तैनात किया गया है जो वर्तमान में एक वेबसाइट के रूप में उपलब्ध है। विशेष रूप से, सोरा वर्तमान में केवल निर्दिष्ट दर सीमा के साथ चैटजीपीटी के भुगतान वाले ग्राहकों के लिए उपलब्ध है।
OpenAI का सोरा AI वीडियो जेनरेशन मॉडल
में एक ब्लॉग भेजाएआई फर्म ने सोरा के लॉन्च की घोषणा की और मॉडल की क्षमताओं के बारे में विस्तार से बताया। सोरा का पहली बार इस साल की शुरुआत में अनावरण किया गया था, और मॉडल में बार-बार देरी हुई है। कंपनी ने कहा था कि देरी के पीछे का कारण मॉडल की सुरक्षा और गोपनीयता मापदंडों को मजबूत करना था।
हालाँकि, लगभग नौ महीने की देरी के बाद, OpenAI ने सोरा को एक स्टैंडअलोन प्लेटफ़ॉर्म के रूप में लॉन्च किया है जिसे एक्सेस किया जा सकता है यहाँ. यह वर्तमान में केवल चैटजीपीटी प्लस और प्रो ग्राहकों के लिए उपलब्ध है। बिना सब्सक्रिप्शन वाले लोग फिलहाल वेबसाइट पर नया अकाउंट नहीं बना सकते हैं। इस बीच, प्लस उपयोगकर्ता हर महीने 480p रिज़ॉल्यूशन पर 50 वीडियो या 720p पर कम वीडियो तक सीमित हैं।
चैटजीपीटी प्रो सदस्यता, जिसे हाल ही में $200 (लगभग 16,970 रुपये) प्रति माह पर पेश किया गया था, उपयोगकर्ताओं को “10 गुना अधिक उपयोग, उच्च रिज़ॉल्यूशन और लंबी अवधि” के साथ वीडियो बनाने देगा। हालाँकि, “कम वीडियो” की तरह, कंपनी ने यह निर्धारित नहीं किया कि उच्च रिज़ॉल्यूशन और लंबी अवधि के तहत क्या होगा।
सोरा वर्तमान में वाइडस्क्रीन, वर्टिकल और स्क्वायर पहलू अनुपात में वीडियो उत्पन्न कर सकते हैं। उपयोगकर्ता सामग्री को विस्तारित करने, रीमिक्स करने और जेनरेट किए गए वीडियो में मिश्रित करने के लिए अपने वीडियो और चित्र भी अपलोड कर सकते हैं। एआई मॉडल टेक्स्ट प्रॉम्प्ट का उपयोग करके स्क्रैच से वीडियो बनाने की भी अनुमति देता है। इसके अतिरिक्त, एक स्टोरीबोर्ड इंटरफ़ेस उपयोगकर्ताओं को प्रत्येक फ्रेम के लिए विशेष इनपुट सेट करने देता है।
तकनीकी बातों की बात करें तो ओपनएआई ने बताया कि सोरा एक प्रसार मॉडल है, जहां एआई के पास 20-सेकंड की अवधि में सामग्री को सुसंगत रखने के लिए एक समय में कई फ़्रेमों की दूरदर्शिता है। AI मॉडल एक ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है, और DALL-E 3 से रीकैप्शनिंग तकनीक लेता है।
OpenAI ने मॉडल डेटा के बारे में विवरण पर भी प्रकाश डाला। कंपनी ने दावा किया कि उसने अपनी डेटा साझेदारी के माध्यम से सार्वजनिक डोमेन से और मॉडल के साथ काम करने वाले लोगों के डेटा की एक विस्तृत श्रृंखला प्राप्त की। कहा गया कि सार्वजनिक डेटा को मशीन लर्निंग डेटासेट और वेब क्रॉल से एकत्र किया गया था।
कंपनी ने शटरस्टॉक पॉन्ड5 के साथ भी साझेदारी की और एआई मॉडल के लिए मालिकाना डेटा उत्पन्न करने के लिए डेटासेट चालू किया। अंत में, सोरा के लिए डेटा एआई प्रशिक्षकों, रेड टीमर्स और कर्मचारियों से भी एकत्र किया गया।
यथार्थवादी एआई वीडियो जेनरेशन मॉडल से जुड़े जोखिमों को कम करने के लिए, ओपनएआई सामग्री प्रावधान और प्रामाणिकता (सी2पीए) गठबंधन द्वारा निर्धारित मानकों के अनुसार दृश्यमान वॉटरमार्क और मेटाडेटा दोनों जोड़ रहा है। कंपनी ने यह भी दावा किया कि उसने मीडिया अपलोड के लिए मॉडल में सुरक्षा जोड़ी है जिसमें लोग शामिल हैं।
एआई फर्म ने यह भी कहा कि सोरा को बाल यौन शोषण और यौन डीपफेक जैसे हानिकारक प्रकार के दुरुपयोग वाले वीडियो बनाने से रोक दिया जाएगा। इसके अतिरिक्त, लॉन्च के समय लोगों द्वारा किए जा सकने वाले अपलोड की संख्या सीमित होगी।