به گزارش خبرنگار گروه علمی و دانشگاهی خبرگزاری فارس به نقل از دیلیمیل، محققان دانشگاههای استنفورد، پرینستون، مرکز پژوهشی مکس پلانک و شرکت Adobe در پروژهای مشترک، موفق به توسعه نوعی الگوریتم دستکاری ویدئو شدهاند که قادر است با تغییر متن، صحبت افراد را درون ویدئو تغییر دهد.
به گفته تیم پژوهش، متد جدید که بر مبنای هوش مصنوعی است با حفظ ساختار و ژست چهره افراد، دیالوگهای جدید را جایگزین متن صحبت قبلی کرده و خروجی آن، یک ویدئوی کاملاً طبیعی از سخنانی است که ویرایش شدهاند.
الگوریتم مورد بحث برای دستکاری ویدئو ابتدا باید فایل اصلی را مورد تحلیل قرار دهد که برای این کار، در حال حاضر به حداقل 40 دقیقه ویدئو از صحبتهای فرد مورد نظر نیاز است. سیستم با دریافت فایل منبع، نحوه تلفظ و ادای کلمات شخص را یادگرفته و مدلی از سر وی ترسیم میکند تا در فرایند دستکاری ویدئو، خروجی قابل باوری ارائه کند.
در مرحله بعد، متن صحبت جدید به الگوریتم داده میشود که الگوریتم آن را با متن اصلی تطابق داده و در بخشهایی که تفاوت وجود دارد، حرکات لب و چهره فرد را تغییر و صدای جدید را هم روی ویدئو قرار میدهد. البته خروجی اولیه به خاطر اتصال تعداد زیادی قطعه ویدئویی کوتاه، تکه تکه به نظر میرسد که الگوریتم در این قسمت با استفاده از فیلتر هوشمند، خروجی نهایی را طبیعی میکند.
گفتنی است یکی از پیشنهادات تیم توسعه، نشاندار کردن ویدئوهای ویرایش شده (واترمارک) است که البته خلافکاران برای دور زدن چنین روشهایی همواره راهی پیدا میکنند و باید منتظر بود و دید که محققان چگونه از سوء استفادهها جلوگیری خواهند کرد.
انتهای پیام/