ابزار هوش مصنوعی مایکروسافت می‌تواند عکس چهره افراد را به ویدیوهای طبیعی تبدیل کند

artificial intelligence can turn a face photo into a video

مایکروسافت یک ابزار آزمایشی هوش مصنوعی جدید به نام VASA-1 را معرفی کرد که می‌تواند تصویر چهره یک شخص یا نقاشی یک نفر و یک فایل صوتی را دریافت کند و یک ویدیوی طبیعی از صحبت کردن شخص تولید کند. این ابزار، توانایی ایجاد حالات چهره و حرکات سر و حرکات مناسب لب برای مطابقت با یک سخنرانی یا یک آهنگ را دارد. محققان نمونه‌های زیادی را در صفحه پروژه آپلود کردند و نتایج بسیار خوب و واقعی به نظر می‌رسند.

با این که حرکات لب و سر در نمونه‌ها می‌تواند با بررسی دقیق‌تر کمی ناهماهنگ و مصنوعی به نظر برسد، واضح است که این فناوری می‌تواند برای ایجاد ویدیوهای جعلی از افراد واقعی مورد سوء استفاده قرار گیرد.

محققین مایکروسافت به خوبی از این خطر آگاه هستند و تصمیم گرفته‌اند تا زمانی که مطمئن نشوند که از فناوری آن‌ها مسئولانه و مطابق با استانداردهای لازم استفاده می‌شود، «دمو، API، محصول، جزئیات پیاده‌سازی یا هر گونه اطلاعات مرتبط» را منتشر نکنند.

محققان بر این باورند که فناوری آن‌ها علیرغم احتمال سوءاستفاده از مزایای زیادی برخوردار است. آن‌ها گفتند که می‌توان از آن برای افزایش برابری آموزشی و همچنین برای بهبود دسترسی کسانی که دارای مشکلات سلامتی و چالش‌های ارتباطی هستند، استفاده کرد.

بر اساس مقاله منتشر شده توسط مایکروسافت، VASA-1 بر روی مجموعه داده‌هایی با نام VoxCeleb2 آموزش دیده است که حاوی «بیش از ۱ میلیون سخنرانی برای ۶۱۱۲ چهره مشهور» بوده و از ویدیوهای یوتیوب استخراج شده است.

Adblock test (Why?)

منبع خبر


دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.