هوش مصنوعی Vasa مایکروسافت برای ساخت چهره‌های سخنگو از روی عکس معرفی شد

—

توسط

مایکروسافت از هوش مصنوعی جدید خود به نام Vasa رونمایی کرد که می‌تواند از روی عکس چهره‌های سخنگو با حرکات لب کاملاً هماهنگ و طبیعی با حرکات سر تولید کند.

به گزارش سرویس اخبار فناوری و تکنولوژی تکنا، مهندسان مایکروسافت به توسعه هوش مصنوعی جدیدی به نام Vasa پرداختند که می‌تواند با کمک تصویر یا فایل صوتی چهره‌های متحرک واقعی تولید کند. نوع یک این مدل ساخته شده با کمک چهارچوب خاصی به ایجاد حالات چهره، حرکات لب به صورتی هماهنگ با حرکات طبیعی سر می‌پردازد. این سیستم می‌تواند در آینده به تجربیات جذاب و واقعی در برنامه‌های مختلف منجر شود.

طبق اعلام مایکروسافت عملکرد این سیستم چیزی فراتر از تطبیق لب با صدا بوده و در آن طیف گسترده‌ای از ظرافت‌های چهره حرکات طبیعی سر و احساسات نیز مشاهده خواهد شد. همچنین چهره‌های ساخته شده توسط این سیستم فناوری بسیار واقعی‌تر است. علاوه بر آن به کاربران اجازه داده می‌شود تا جهت نگاه کردن شخصیت، حالت احساس و فاصله درک شده را مشخص کنند.

طبق گفته مایکروسافت این سیستم هیچگونه آموزشی با کمک عکس‌های هنری صدای آواز یا گفتار غیر انگلیسی ندیده اما امکان تولید ویدیو با استفاده از این ورودی‌ها را خواهد داشت. مایکروسافت در ادامه توضیحات خود می‌گوید این سیستم قادر به تولید ویدیوها با وضوح بالا بوده و نرخ فریم ویدیوهای تولید شده نیز بسیار بالا است. Vasa1 می‌تواند در حالت آفلاین ویدیوهایی با سرعت ۴۵ فریم در ثانیه ایجاد کند و در شکل آنلاین سرعت آن به ۴۰ فریم در ثانیه می‌رسد.

مایکروسافت معتقد است در آینده این سیستم می‌تواند پتانسیل سوء استفاده از سیستم‌های هوش مصنوعی را برجسته‌تر کند. همچنین از کاربردهای این سیستم می‌توان به تجربیات آموزشی بهتر و افزایش زمینه ارتباطات اشاره کرد. در نمونه منتشر شده تصویری از نقاشی معروف مونا لیزا در حال صحبت کردن منتشر شد که قابلیت و عملکرد این مدل را نشان می دهد.

Adblock test (Why?)

لینک منبع خبر

دیدگاه‌ها

دیدگاهتان را بنویسید لغو پاسخ

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.