اخبار دانش و فناوری

دو دانشجو مدل هوش مصنوعی جدیدی برای رقابت با NotebookLM گوگل ساختند

دو دانشجوی کارشناسی که تخصصی زیادی نیز در زمینه هوش مصنوعی ندارند ادعا می‌کنند توانسته‌اند مدل هوش مصنوعی تازه‌ای بسازند که قادر است محتواهایی به سبک پادکست مشابه NotebookLM گوگل خلق کند.

به گزارش تک کرانچ ، «توبی کیم»، یکی از بنیانگذاران Nari Labs که این مدل جدید گفتاری را منتشر کرده، گفت او و یکی دیگر از همکارانش حدوداً ۳ ماه پیش شروع به یادگیری درباره مدل‌های هوش مصنوعی گفتاری کردند. این تیم با الهام از NotebookLM گوگل می‌خواستند مدلی بسازند که کنترل بیشتری روی صداهای تولیدشده و آزادی در سناریو را به کاربران ارائه دهد.

تیم سازنده ادعا می‌کند این مدل توانایی رقابت با NotebookLM گوگل را دارد

به گفته توبی کیم، آنها از برنامه TPU Research Cloud گوگل برای ساخت این مدل استفاده کرده‌اند تا بتوانند مدل Nari با نام Dia را آموزش دهند. این برنامه امکان دسترسی رایگان به تراشه‌های هوش مصنوعی TPU گوگل را برای محققان فراهم می‌کند.

مدل Dia با استفاده از ۱.۶ میلیارد پارامتر می‌تواند دیالوگ‌ها را از روی یک اسکریپت تولید کند. همچنین این مدل به کاربران این امکان را می‌دهد تا لحن سخنران را سفارشی کرده و مواردی همچون ناهماهنگی‌ها، سرفه‌ها، خنده‌ها و سایر نشانه‌های غیرکلامی را اضافه کنند.

هوش مصنوعی

مدل Dia هم‌اکنون از طریق پلتفرم‌های Hugging Face و GitHub در دسترس علاقه‌مندان قرار دارد. این مدل می‌تواند روی اکثر رایانه‌های شخصی مدرن با حداقل ۱۰ گیگابایت VRAM اجرا شود. همچنین Dia قادر است تا در صورتی که دستورالعمل‌های خاصی دریافت نکند، به‌صورت رندوم اقدام به ساخت یک صدای تصادفی کند. علاوه‌براین، Dia توانایی تقلید صدای افراد را دارد.

بااین‌حال، مانند بسیاری از مدل‌های صوتی، Dia نیز حفاظت بسیار کمی در برابر سوءاستفاده‌های احتمالی دارد و سازندگان گفته‌اند که مسئولیتی را دراین‌باره قبول نمی‌کنند. همچنین Nari Labs فاش نکرده که از چه دیتاهایی برای آموزش این مدل استفاده کرده است. این احتمال وجود دارد که از دیتا‌های دارای حق کپی رایت برای آموزش Dia استفاده شده باشد.

Adblock test (Why?)

لینک منبع خبر

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x