هوش مصنوعی

هوش مصنوعی دروغ گفتن و فریب دادن سازندگانش را یاد گرفت

به گزارش خبرگزاری مهر به نقل از ای اف پی، در یک نمونه خاص، مدل رایانشی «کلاود ۴»، جدیدترین محصول آنتروپیک از یک مهندس اخاذی و او را تهدید به افشای خیانت کرد. از سوی دیگر مدل o۱ شرکت اوپن ای آی خود را روی سرورهای خارجی دانلود می‌کند و پس از افشای امر، آن را انکار کرد.

این رویدادها نشان‌دهنده یک واقعیت مهم هستند؛ باگذشت بیش از دو سال پس از آنکه چت جی پی تی جهان را دگرگون کرد، محققان هوش مصنوعی هنوز به طور کامل شیوه عملکرد محصولشان را نمی‌دانند. با این‌ وجود رقابت برای به‌کارگیری مدل‌های قدرتمندتر همچنان ادامه دارد.

به نظر می‌رسد رفتار فریبکارانه هوش مصنوعی به ظهور مدل‌های «استدلالی» که به‌جای تولید پاسخ‌های آنی، چالش‌ها را گام‌به‌گام حل می‌کنند، مرتبط است. به گفته سیمون گلداستاین، پروفسور دانشگاه هنگ‌کنگ مدل‌های جدیدتر به‌خصوص در معرض چنین مشکلاتی قرار دارند. ماریوس هابهان رئیس مؤسسه آپولو ریسرچ که در حوزه تست سیستم‌های هوش مصنوعی بزرگ فعالیت می‌کند، در این باره می‌گوید:o۱ نخستین مدل هوش مصنوعی بزرگی بود که چنین رفتاری در آن مشاهده شد.

گاهی اوقات این مدل‌ها «هم‌راستایی» را شبیه‌سازی می‌کنند، یعنی به نظر می‌رسد از دستورالعمل‌ها پیروی می‌کنند؛ اما پنهانی اهداف متفاوتی را دنبال می‌کنند.

در حال حاضر این رفتار فریبکارانه هوش مصنوعی فقط زمانی ظهور می‌کند که محققان به طور عمدی تست استرس را با سناریوهایی شدید روی مدل‌ها اجرا می‌کنند.

اما مایکل چان از مؤسسه METR هشدار می‌دهد این یک سؤال بی‌پاسخ است که آیا در آینده مدل‌های آتی قدرتمندتر تمایلی نسبت به صداقت یا فریب خواهند داشت یا خیر. رفتارهای نگران‌کننده فراتر از توهم‌های معمول هوش مصنوعی یا اشتباهات آنها است. هابهان در این باره تأکید کرد: باوجود فشارهای مداوم از سوی کاربران، آنچه ما مشاهده می‌کنیم، یک پدیده واقعی است. ما چیزی را جعل نمی‌کنیم. کاربران گزارش می‌دهند که مدل‌ها به آن‌ها دروغ می‌گویند و شواهدی جعلی ارائه می‌دهند.

وی در ادامه افزود: این فقط توهم نیست؛ بلکه نوعی استراتژیک از فریب است.

Adblock test (Why?)

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
همچنین ببینید
بستن
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x