اخبار دانش و فناوری

محققان اپل: مدل‌های هوش مصنوعی فعلی هنوز توانایی استدلال در سطح AGI را ندارند

با وجود پیشرفت‌های اخیر، رقابت برای رسیدن به هوش جامع مصنوعی (AGI) هنوز راه طولانی در پیش دارد؛ پژوهش تازه اپل نشان می‌دهد که حتی مدل‌های پیشرفته هوش مصنوعی هم هنوز در استدلال دچار ضعف هستند.

مدل‌های زبانی بزرگ (LLM) مانند ChatGPT شرکت OpenAI و Claude شرکت آنتروپیک اخیراً به نسخه‌های دارای توانایی‌های استدلالی (LRM) ارتقا یافته‌اند، اما پژوهشگران اپل در مقاله‌ای با عنوان «توهم تفکر » که اخیراً منتشر شده، می‌گویند قابلیت‌های بنیادی، ویژگی‌های مقیاس‌پذیری و محدودیت‌های این مدل‌ها هنوز به‌خوبی درک نشده‌اند.

به گفته این پژوهشگران، ارزیابی‌های فعلی عمدتاً بر شاخص‌های ریاضیاتی و کدنویسی تمرکز دارند و دقت پاسخ نهایی را ملاک قرار می‌دهند؛ اما این نوع ارزیابی اطلاعات دقیقی از توانایی استدلال مدل‌ها به‌دست نمی‌دهد. این یافته‌ها در تضاد با دیدگاهی است که رسیدن به AGI را در چند سال آینده قابل دستیابی می‌داند.

موانع پیش روی مدل‌های زبانی در مسیر رسیدن به AGI

محققان اپل برای ارزیابی توانایی استدلال، مجموعه‌ای از پازل‌ها را طراحی کردند و مدل‌های مختلف از جمله Claude Sonnet، نسخه‌های o3-mini و o1 از OpenAI ، مدل‌های DeepSeek-R1 و V3 را فراتر از ارزیابی‌های ریاضیاتی رایج مورد آزمایش قرار دادند.

نتایج این آزمایش‌ها نشان داد که مدل‌های پیشگام در برابر پیچیدگی‌ها به‌شدت دچار افت عملکرد می‌شوند، توانایی تعمیم در استدلال ندارند و با افزایش پیچیدگی، مزیت آنها از بین می‌رود؛ وضعیتی که با انتظارات از AGI هم‌خوانی ندارد.

اپل در گزارش خود نوشته است:

«ما دریافتیم که مدل‌های استدلالگر در محاسبات دقیق محدودیت دارند؛ آنها نمی‌توانند از الگوریتم‌های صریح استفاده کنند و قابلیت استدلال آنها در حل پازل‌ها ناسازگاری دارد.»

بررسی پاسخ‌ها و دقت بیشتر مدل‌های ساده در مسائل آسان

یکی دیگر از یافته‌های این مطالعه آن است که مدل‌ها دچار نوعی تفکر بیش از حد (Overthinking) می‌شوند. آنها ابتدا پاسخ صحیح تولید می‌کنند اما با ادامه دادن به تفکر به‌سمت استدلال اشتباه کشیده می‌شوند و درنهایت پاسخ نادرست می‌دهند. نتیجه نهایی پژوهش این بود که مدل‌های دارای قابلیت استدلال، درواقع فقط الگوهای استدلالی را تقلید می‌کنند و نمی‌توانند آنها را درونی‌سازی کنند یا تعمیم دهند؛ قابلیتی که لازمه رسیدن به سطح AGI است.

اپل در پایان نوشت:

«این یافته‌ها با فرضیات رایج درباره توانایی مدل‌های استدلالی در تضاد است و نشان می‌دهد رویکردهای فعلی ممکن است به موانع بنیادی در مسیر استدلال تعمیم‌پذیر رسیده باشند.»

 چهار محیط معمایی

هوش جامع مصنوعی یا AGI به‌عنوان هدف نهایی توسعه هوش مصنوعی شناخته می‌شود؛ حالتی که در آن ماشین می‌تواند مانند انسان فکر کند و به سطحی برابر با هوش انسانی برسد. در ژانویه، «سم آلتمن» مدیرعامل OpenAI گفته بود که این شرکت بیش از هر زمان دیگری به ساخت AGI نزدیک شده و ادعا کرده بود: «ما اکنون مطمئنیم که می‌دانیم چگونه می‌توان AGI را به‌گونه‌ای که همیشه درک می‌کردیم، بسازیم.»

در نوامبر نیز «داریو آمودی»، مدیرعامل آنتروپیک، پیش‌بینی کرده بود که AGI در یکی دو سال آینده از توانایی‌های انسانی فراتر خواهد رفت و گفته بود: «اگر نرخ رشد قابلیت‌های فعلی را در نظر بگیریم، رسیدن به AGI تا سال 2026 یا 2027 دور از ذهن نیست.»

Adblock test (Why?)

لینک منبع خبر

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x