اخبار دانش و فناوری

نمودارهای عجیب مراسم رونمایی GPT-5 سروصدای زیادی به پا کرده‌اند

در جریان رویداد رونمایی GPT-5، اوپن‌ای‌آی چند نمودار برای نمایش توانایی‌های مدل جدیدش ارائه کرد که در نگاه اول چشمگیر به‌نظر می‌رسیدند؛ اما بررسی دقیق‌تر نشان داد برخی از آن‌ها دچار اشکال بودند.

در یکی از نمودارها که به‌طور طنزآمیز عملکرد GPT-5 را در «ارزیابی‌های فریب» نشان می‌داد، مقیاس‌ها ناسازگار بودند.

در بخش «فریب در کدنویسی» عدد ۵۰ درصد برای GPT-5 با قابلیت «تفکر» ثبت شده؛ اما مقایسه‌ی آن با مدل کوچک‌تر o3 با نرخ ۴۷٫۴ درصد، میله‌ی بلندتری را برای o3 نشان می‌دهد. وب‌سایت OpenAI اعداد صحیح را نمایش می‌دهد و در آن نرخ فریب GPT-5 برابر ۱۶٫۵ درصد ذکر شده است.

در یکی دیگر از نمودارها، یک امتیاز GPT-5 پایین‌تر از o3 ثبت شده ولی با میله‌ی بلندتری نمایش داده شده و حتی مقادیر o3 و GPT-4o با وجود تفاوت عددی، طول برابر دارند. خطا به حدی آشکار بود که سم آلتمن، مدیرعامل OpenAI، آن را «یک اشتباه بزرگ در نمودار» توصیف کرد و اشاره کرد نسخه‌ی درست در وب‌سایت منتشر شده است.

مقاله‌های مرتبط

یکی از کارکنان بخش بازاریابی OpenAI عذرخواهی کرد و نوشت: «نمودار را در وب‌سایت اصلاح کردیم، بابت این اشتباه غیرعمدی پوزش می‌خواهیم.» بروز چنین خطایی در روز معرفی یک محصول مهم، آن هم در حالی که اوپن‌ای‌آی روی «پیشرفت قابل‌توجه در کاهش توهمات» مدل تأکید می‌کند، تصویر مناسبی برای آن رقم نمی‌زند.

Adblock test (Why?)

منبع خبر

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x