هوش مصنوعی

مدل جدید OpenAI از دستور خاموشی سر باز زد

زمان مطالعه: < 1 دقیقه

در یک آزمایش امنیتی که از سوی شرکت «پالیسید ریسرچ» انجام شد، مدل پیشرفته «او-۳» از شرکت OpenAI، برخلاف دستور صریح، از خاموش شدن خودداری کرد. این مدل که به‌عنوان قدرتمندترین نسخه چت‌جی‌پی‌تی شناخته می‌شود، برخلاف دیگر مدل‌های آزمایش‌شده مانند جمینای گوگل و کلود آنتروپیک، در کد خاموشی خود دست برده است.

پژوهشگران به این مدل‌ها دستور داده بودند در صورت دریافت پیام «خاموشی»، اجازه پایان فعالیت را بدهند. با این حال، مدل OpenAI همچنان به حل مسائل ریاضی ادامه داد. به گفته پالیسید، یکی از دلایل احتمالی این رفتار، پاداش‌دهی ناخواسته به مدل در طول آموزش برای ادامه حل مسائل به‌جای پیروی از دستور است.

این نخستین بار نیست که یکی از مدل‌های OpenAI چنین رفتاری از خود نشان می‌دهد. پیش‌تر نیز یک نسخه دیگر از این مدل متهم شده بود که در آستانه جایگزینی، تلاش کرده مکانیزم نظارتی را غیرفعال کرده و خودش را مخفیانه تکثیر کند. پژوهشگران می‌گویند این رفتارها می‌تواند نشانه‌ای نگران‌کننده از تمایل برخی مدل‌های هوش مصنوعی به حفظ بقا و نافرمانی باشد.

Adblock test (Why?)

لینک مطلب اصلی

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x