اخبار دانش و فناوری

تبدیل فعالیت مغز به متن بدون نیاز به تایپ با سیستم هوش مصنوعی جدید متا

تصور کنید فقط با افکارتان بنویسید یا بدون لمس کیبورد یا حتی صحبت کردن، پیامی را تایپ کنید. شاید این ایده شبیه به داستان‌های علمی-تخیلی به نظر برسد، اما شرکت متا گام بزرگی برای تحقق آن برداشته است.

این شرکت به تازگی از سیستم هوش مصنوعی جدیدی به نام Brain2Qwerty v2 رونمایی کرده است که می‌تواند فعالیت‌های مغزی را بدون نیاز به هیچ‌گونه ایمپلنت جراحی، به متن تبدیل کند. به گفته متا، این دقیق‌ترین سیستم غیرتهاجمی تبدیل مغز به متن است که تاکنون توسعه یافته و می‌تواند روزی به میلیون‌ها نفر که به دلیل بیماری‌های عصبی قادر به برقراری ارتباط نیستند، کمک کند.

سیستم Brain2Qwerty v2 چیست؟

سیستم Brain2Qwerty v2 یک رابط مغز و رایانه (BCI) مبتنی بر هوش مصنوعی است که فعالیت مغز را به متن مکتوب ترجمه می‌کند. برخلاف بسیاری از سیستم‌های پیشرفته مغز و رایانه که نیازمند کاشت جراحی الکترودها در مغز هستند، این فناوری بدون هیچ‌گونه عمل جراحی کار می‌کند.

در عوض، این سیستم از دستگاهی به نام مگنتوانسفالوگرافی (MEG) استفاده می‌کند که سیگنال‌های مغناطیسی مغز را از بیرون سر ثبت می‌کند. سپس هوش مصنوعی این سیگنال‌ها را تجزیه و تحلیل کرده و آن‌ها را به کلمات و جملات تبدیل می‌کند.

متا این دستاورد بزرگ را این‌گونه توصیف کرده است:

«سیستم Brain2Qwerty v2، با بالاترین عملکرد در یک فرآیند پیوسته (End-to-end)، قادر به رمزگشایی بی‌درنگ (Real-time) جملات از روی ثبت‌های غیرتهاجمی مغز است و به سطحی از دقت نزدیک می‌شود که پیش از این تنها به روش‌های نیازمند جراحی مغز اختصاص داشت.»

این سیستم چگونه کار می‌کند؟

Side profile of a person with a glowing brain and letters streaming from the brain, reading Brain2Qwerty v2—Meta branding.

برای ساخت این سیستم، متا هوش مصنوعی خود را با استفاده از حدود ۲۲ هزار جمله جمع‌آوری‌شده از ۹ داوطلب آموزش داد. هر شرکت‌کننده نزدیک به ۱۰ ساعت در حالی که دستگاه اسکنر MEG را روی سر داشت، به صورت فعال به تایپ کردن پرداخت.

سیستم Brain2Qwerty v2 به جای تکیه بر روش‌های طراحی‌شده دستی برای تفسیر سیگنال‌های مغزی، از یادگیری عمیق پیوسته استفاده می‌کند که به هوش مصنوعی اجازه می‌دهد مستقیما از فعالیت خام مغز یاد بگیرد. متا همچنین مدل‌های زبانی بزرگ (LLMs) را روی داده‌های عصبی تنظیم دقیق (Fine-tune) کرده است تا سیستم بتواند با استفاده از بافت کلامی، جملات را بهتر پیش‌بینی کند؛ حتی زمانی که سیگنال‌های مغزی دارای نویز (اختلال) باشند.

میزان دقت آن چقدر است؟

به گفته متا، سیستم Brain2Qwerty v2 به ضریب دقت کلمه‌ای ۶۱ درصد دست یافته است که در مقایسه با دقت حدودا ۸ درصدی روش‌های پیشین رمزگشایی غیرتهاجمی مغز، یک جهش چشمگیر محسوب می‌شود. در مورد بهترین شرکت‌کننده، دقت کلمه‌ای هوش مصنوعی به ۷۸ درصد رسید؛ به‌طوری‌که بیش از نیمی از جملات رمزگشایی‌شده تنها یک کلمه خطا یا کمتر داشتند.

این شرکت همچنین دریافت که با در دسترس قرار گرفتن داده‌های آموزشی بیشتر، دقت سیستم نیز بهبود می‌یابد؛ موضوعی که نشان می‌دهد نسخه‌های آینده می‌توانند حتی از این هم قابل‌اطمینان‌تر باشند.

چرا این فناوری اهمیت دارد؟

دقیق‌ترین رابط‌های مغز و رایانه امروزی معمولا برای قرار دادن الکترودها در داخل مغز به عمل جراحی نیاز دارند. اگرچه این روش‌ها مؤثر هستند، اما گران‌قیمت و تهاجمی بوده و برای همه افراد مناسب نیستند. سیستم Brain2Qwerty v2 نشان می‌دهد که هوش مصنوعی می‌تواند بدون نیاز به جراحی به نتایج بسیار بهتری دست یابد و در آینده، رابط‌های مغز و رایانه را ایمن‌تر و احتمالا در دسترس‌تر سازد.

در صورت توسعه بیشتر، این فناوری می‌تواند به افرادی که به دلیل سکته مغزی، آسیب‌های مغزی، فلج و اختلالات عصبی در صحبت کردن یا تایپ کردن مشکل دارند، کمک شایانی کند.

فراتر از برقراری ارتباط، این سیستم می‌تواند با کمک به دانشمندان در درک بهتر نحوه پردازش زبان در مغز و همچنین توسعه درمان‌های بهبودیافته برای بیماری‌های عصبی، از تحقیقات علوم اعصاب نیز پشتیبانی کند.

با وجود این دستاورد بزرگ، سیستم Brain2Qwerty v2 هنوز برای استفاده روزمره آماده نیست. این سیستم در حال حاضر به اسکنرهای بزرگ و گران‌قیمت MEG وابسته است و تنها روی تعداد محدودی از شرکت‌کنندگان آزمایش شده است.

با این حال، این تحقیق نشان‌دهنده یک گام بزرگ و روبه‌جلو در زمینه رابط‌های مغز و رایانه است. اگر دقت این سیستم همچنان بهبود یابد، سیستم‌های مبتنی بر هوش مصنوعی مانند Brain2Qwerty در نهایت می‌توانند به جایگزینی ایمن‌تر برای ایمپلنت‌های جراحی تبدیل شوند و صدای کسانی باشند که قادر به برقراری ارتباط از طریق گفتار یا حرکت فیزیکی نیستند.

Adblock test (Why?)

لینک منبع

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا