هوش مصنوعی

شکستی بزرگ برای ChatGPT

زمان مطالعه: 3 دقیقه

طی ماه‌های گذشته، «سم آلتمن»، مدیرعامل شرکت OpenAI، با سروصدای زیادی بر قابلیت‌های GPT-5 تأکید کرده و عرضه آن را لحظه‌ای سرنوشت‌ساز برای این شرکت معرفی کرده بود. اما در ۲۴ ساعت اول پس از انتشار، این مدل جدید با واکنش‌های متفاوت و انتقادهایی روبرو شد.

در اطلاعیه روز پنجشنبه خود، OpenAI  اعلام کرد که GPT-5 در کدنویسی و استدلال برای حل مشکلات پیچیده عملکرد بهتری دارد و آن را به قدری پیشرفته دانست که می‌تواند چت‌بات ChatGPT را به یک متخصص در سطح دکترا تبدیل کند. همچنین برخی از افرادی که دسترسی زودهنگامی به این مدل داشتند، آن را ستوده بودند.

«سایمون ویلیسون»، توسعه ‌دهنده، در یک پست وبلاگی نوش بود: «این مدل جدید مورد علاقه من است.» او آن را «کارآمد» و «گاهی اوقات تأثیرگذار» توصیف کرد، اما افزود: «تفاوت چشمگیری با آنچه قبلاً داشتیم، ندارد.»

با این حال، در پلتفرم‌های مختلف شبکه‌های اجتماعی، کاربران ChatGPT از این موضوع ابراز ناراحتی کردند که GPT-5 همچنان به ساخت اطلاعات نادرست ادامه می‌دهد و در مسائل ساده ریاضی و سؤالات املایی دچار مشکل می‌شود.

«نوآ جیانسیراکوسا»، دانشیار ریاضیات در دانشگاه بنتلی، گفت که عرضه این مدل را «ناامیدکننده» می‌داند. او اظهار داشت، در حالی که برخی پیشرفت‌ها وجود داشته، «آن‌ها بسیار جزئی‌تر از آن چیزی بودند که من انتظار داشتم.»

دست‌کم بخشی از این واکنش‌ها ممکن است ناشی از سردرگمی درباره عملکرد درونی این مدل باشد. برخلاف نرم‌افزارهای قبلی OpenAI، مدل GPT-5 بسته به نوع درخواست، به ‌صورت خودکار بین مدل‌هایی با سطوح پیچیدگی متفاوت جابه‌جا می‌شود. این رویکرد می‌تواند به بهینه‌سازی منابع محاسباتی شرکت کمک کند، اما در عین حال به این معنی است که ممکن است کاربران همیشه با قدرتمندترین نسخه از فناوری OpenAI سروکار نداشته باشند.

هنگامی که از GPT-5 خواسته شد تعداد دفعات تکرار حرف «b» در کلمه «blueberry» را مشخص کند، در یک آزمون اولیه پاسخ «۳» را ارائه داد. اما زمانی که به آن گفته شد «دقیق‌تر فکر کن»، به نظر می‌رسد که مدل استدلالی پیشرفته‌تر خود را فعال کرد و به پاسخ صحیح دست یافت.

روز جمعه، آلتمن به برخی از بازخوردها پاسخ داد و گفت که یک مشکل سیستمی وجود داشته است. او اظهار داشت: «GPT-5 از امروز باهوش‌تر به نظر خواهد رسید. دیروز، سیستم تعویض خودکار از کار افتاد و برای بخش قابل توجهی از روز از دسترس خارج بود که در نتیجه،GPT-5 بسیار احمقانه‌تر به نظر می‌رسید.»

همچنین تقریباً تمام کاربران ChatGPT دیگر دسترسی به مدل‌های قبلی GPT ندارند که این امر موجب نارضایتی برخی از کاربران شده. هرچند که پس از اعتراضات فراوان، شرکت OpenAI دسترسی دوباره به مدل GPT-4o را برای کاربران plus فعال کرده و این کاربران می‌توانند بجای مدل جدیدی که پنج‌شنبه ارائه شده، مدل قدیمی‌تر و احتمالاً بهتر را استفاده کنند.

انتشار این محصول با چالش‌های بزرگی برای OpenAI همراه است. این شرکت تلاش می‌کند تا در رقابت فزاینده هوش مصنوعی با رقبای خود در ایالات متحده و چین پیشتاز باقی بماند. همچنین، OpenAI می‌کوشد تا کسب‌وکارها و کاربران عادی را متقاعد کند برای خدمات ویژه آن هزینه پرداخت کنند، تا بتواند هزینه‌های هنگفتی را که صرف استعدادها، تراشه‌ها و مراکز داده برای توسعه هوش مصنوعی می‌شود، جبران کند.

این شرکت مستقر در سان‌فرانسیسکو، نزدیک به سه سال پیش با عرضه ChatGPT که در ابتدا با یک مدل قدیمی‌تر به نام GPT-3.5 کار می‌کرد، موج هوش مصنوعی مولد (generative AI) را آغاز کرد. از آن زمان تا کنون، این شرکت مجموعه‌ای از سیستم‌های پیچیده‌تر، از جمله گزینه‌های متعددی را منتشر کرده است که روند استدلال انسانی را شبیه‌سازی می‌کنند.

با پیشرفت سیستم‌های هوش مصنوعی، ارائه یک دیدگاه قطعی درباره عملکرد خدمات مختلف دشوارتر شده است. تا اواسط روز جمعه، GPT-5 در صدر دسته‌بندی‌های مختلف در LMArena که یک جدول امتیازات محبوب برای مدل‌های هوش مصنوعی بر اساس رتبه‌بندی کاربران است، قرار گرفته بود. اما یک معیار متفاوت دیگر، یعنی ARC-AGI-2، GPT-5 را پشت سر جدیدترین نسخه Grok از xAI ایلان ماسک قرار داده.

در نبود ارزیابی‌های قطعی‌تر، رقابت مدل‌های هوش مصنوعی گاهی به حس و حال و برداشت‌های شخصی کاربران بستگی دارد. با توجه به اینکه نزدیک به ۷۰۰ میلیون نفر هر هفته از ChatGPT استفاده می‌کنند، طبیعی است که نظرات متفاوتی در مورد عملکرد آن وجود داشته باشد. علاوه بر این، ارزیابی ارزش یک سیستم هوش مصنوعی جدید در زندگی شخصی و حرفه‌ای هر فرد، به زمان بیشتری از یک روز نیاز دارد.

«اتان مولیک»، استاد دانشکده وارتون دانشگاه پنسیلوانیا که به طور مداوم با مدل‌های هوش مصنوعی آزمایش می‌کند، از توانایی GPT-5 در انجام تحقیقات، ارائه پاسخ‌های هوشمندانه و نوشتاری، و ساده‌سازی برنامه‌نویسی، حتی برای افراد مبتدی، ابراز شگفتی کرد.

او در یک پست وبلاگی نوشت: «GPT-5 کارهایی انجام می‌دهد که اغلب خارق‌العاده، گاهی عجیب و غریب، و بعضی اوقات بسیار هوش مصنوعی گونه هستند و همین مسئله آن را تا این حد جالب می‌کند.»

با این حال، در ردیت، واکنش‌ها بسیار متفاوت بود. در جلسه پرسش و پاسخ (AMA) روز جمعه در این پلتفرم، آلتمن با انتقاداتی از سوی کاربران روبرو شد که از نداشتن حق اظهار نظر و عدم شفافیت در مورد اینکه کدام مدل به درخواست‌های آن‌ها پاسخ می‌دهد، ناراضی بودند. آلتمن گفت که OpenAI اقداماتی برای رسیدگی به این شکایات انجام خواهد داد، از جمله «شفاف‌تر» کردن موضوعات مطرح شده.

در نقطه‌ای از جلسه، آلتمن در پاسخ به سؤال یک کاربر در ردیت، اشاره کرد که OpenAI فکر می‌کند «کیفیت نوشتاری» یکی از نسخه‌های GPT-5 بهتر از GPT-4.5 است. سپس او پرسید: «آیا شما فکر می‌کنید بدتر است؟» و کاربران یکی پس از دیگری به سرعت پاسخ دادند: بله.

Adblock test (Why?)

لینک مطلب اصلی

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا