هوش مصنوعی

توهم‌ در مدل‌های جدید ChatGPT نگرانی‌ها را افزایش داد

زمان مطالعه: < 1 دقیقه

شرکت OpenAI به‌تازگی مدل‌های پیشرفته هوش مصنوعی خود، o3 و o4-mini، را معرفی کرده که در زمینه‌هایی مانند کدنویسی و حل مسائل ریاضی عملکردی خیره‌کننده دارند. اما این مدل‌ها با مشکلی جدی روبه‌رو هستند: توهم‌زایی، یعنی تولید اطلاعات نادرست یا ساختگی.

برخلاف انتظار، این مدل‌ها نسبت به مدل‌های قبلی OpenAI، مانند o1 و GPT-4o، بیشتر دچار توهم می‌شوند. این موضوع، که حتی خود OpenAI دلیل دقیق آن را نمی‌داند، نگرانی‌هایی درباره دقت این فناوری‌های جدید ایجاد کرده است.

بر اساس گزارش‌های OpenAI، مدل o3 در ۳۳ درصد از سؤالات مربوط به اطلاعات شخصی (بنچمارک PersonQA) اطلاعات نادرست تولید می‌کند، در حالی که این رقم برای مدل‌های قبلی o1 و o3-mini به ترتیب ۱۶ و ۱۴.۸ درصد بود.

مدل o4-mini حتی بدتر عمل کرده و در ۴۸ درصد موارد توهم‌زایی داشته است. آزمایش‌های مستقل توسط آزمایشگاه Transluce نیز نشان داده که o3 گاهی ادعاهای غیرواقعی درباره فرآیند پاسخ‌گویی خود مطرح می‌کند، مانند اجرای کد روی دستگاهی خیالی. کارشناسان معتقدند روش‌های یادگیری استفاده‌شده در این مدل‌ها ممکن است این مشکل را تشدید کرده باشد.

این توهم‌زایی می‌تواند کاربرد مدل‌های جدید را در زمینه‌هایی مانند حقوق یا پزشکی، که دقت حیاتی است، محدود کند. با این حال، OpenAI در حال بررسی راه‌حل‌هایی مانند افزودن قابلیت جستجوی وب است که می‌تواند دقت را بهبود بخشد. برای مثال، مدل GPT-4o با جستجوی وب تا ۹۰ درصد دقت دارد. در حالی که OpenAI و صنعت هوش مصنوعی به سمت مدل‌های استدلالی پیشرفته حرکت می‌کنند، حل مشکل توهم‌زایی به چالشی کلیدی تبدیل شده که نیازمند تحقیقات بیشتری است.

Adblock test (Why?)

لینک مطلب اصلی

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x