الذكاء الإصطناعي

نجح باحثون صينيون في تطوير تقنية متقدمة قد تعيد رسم مستقبل إنتاج الفيديو بالذكاء الاصطناعي، بعد أن تمكنوا من تقليص زمن التوليد بشكل غير مسبوق ليقترب من الأداء شبه الفوري، في إنجاز يُعد نقلة نوعية في هذا المجال سريع التطور.
ووفقًا لورقة بحثية حديثة، تعتمد التقنية الجديدة التي تحمل اسم TurboDiffusion على أسلوب مبتكر يسرّع عملية توليد الفيديو بما يصل إلى 200 ضعف، دون التأثير على جودة الصورة أو تماسك المشاهد، ما يفتح الباب أمام استخدامات تجارية وتفاعلية كانت حتى وقت قريب غير عملية.

التقنية طُورت على يد فريق مشترك من جامعة تسينغهوا في بكين، وشركة Shengshu المتخصصة في نماذج الذكاء الاصطناعي، وبالتعاون مع جامعة كاليفورنيا – بيركلي. وأظهرت الاختبارات أن إنشاء مقطع فيديو مدته خمس ثوانٍ وبدقة عادية انخفض من أكثر من ثلاث دقائق إلى نحو 1.9 ثانية فقط، عند تشغيل النموذج على جهاز استهلاكي مزود ببطاقة Nvidia RTX 5090.
أما في حالة الفيديو عالي الدقة، فقد حققت TurboDiffusion قفزة أكبر، إذ تقلص زمن التوليد من قرابة 80 دقيقة إلى 24 ثانية فقط على الجهاز نفسه، وهو ما يعادل تسريعًا يقارب 200 مرة، بحسب نتائج الدراسة التي أشار إليها تقرير لموقع South China Morning Post.

ويبرز هذا الإنجاز في وقت لا تزال فيه كبرى منصات توليد الفيديو تعاني من بطء نسبي. فعلى سبيل المثال، يستغرق إنشاء فيديو قصير عبر منصة Vidu التابعة لشركة Shengshu ما بين ثلاث وخمس دقائق، فيما أوضحت OpenAI سابقًا أن نموذجها الشهير Sora يحتاج عدة دقائق لإنتاج مقاطع قصيرة مماثلة.
ويرى محللون أن هذا التقدم يعكس السرعة اللافتة التي حققها الباحثون الصينيون في مجال توليد الفيديو بالذكاء الاصطناعي منذ الكشف عن Sora في فبراير 2024، في سباق تقني تتقلص فيه الفجوات الزمنية بشكل متسارع. ويقول محلل الصناعة كيون شو إن تسريع التوليد بهذا الشكل يمثل نقطة تحول، لأن بطء الإنتاج كان أحد أكبر العوائق أمام اعتماد هذه النماذج في سلاسل العمل الإبداعية والتجارية.

ويعزو الباحثون هذا الاختراق إلى تحسينات جوهرية في طريقة تدريب النماذج، أبرزها استخدام تقنية تُعرف باسم «الانتباه الخطي المتناثر»، التي تسمح للنموذج بالتركيز على الأجزاء الأكثر أهمية من البيانات بدل معالجتها بالكامل، ما يقلل زمن الحساب واستهلاك الموارد الحوسبية بشكل كبير.
من جهتها، علّقت مؤسسة AI Native Foundation، المعنية بتعزيز الاستخدام العادل والشامل للذكاء الاصطناعي، بأن TurboDiffusion تمثل انتقالًا من مجرد القدرة على توليد الفيديو إلى مرحلة التوليد الفوري، وهو ما يفتح آفاقًا جديدة لتطبيقات آنية في الإعلام، والتجارة، والتعليم، والترفيه.
وأضافت المؤسسة أن التقنية ستساعد الشركات على إنتاج محتوى فيديو عالي الجودة بسرعة أكبر وبتكلفة أقل، كما توفر معيارًا مفتوح المصدر متقدمًا يمكن للباحثين والمطورين البناء عليه لتطوير تطبيقات تفاعلية في الزمن الحقيقي.
وتتوفر تقنية TurboDiffusion بالكامل كمشروع مفتوح المصدر عبر منصة GitHub، ما يعزز فرص انتشارها واعتمادها سريعًا داخل مجتمع الذكاء الاصطناعي العالمي، ويجعلها واحدة من أبرز الابتكارات المنتظرة في مجال توليد الفيديو خلال الفترة المقبلة.



