هوش مصنوعی

مردم برای سرگرمی چت‌بات‌های هوش مصنوعی را هک می‌کنند

زمان مطالعه: < 1 دقیقه

مطالعه‌ای تازه که در مجله PLOS One منتشر شده، به بررسی فعالیت گروه‌هایی موسوم به «تیم قرمز LLM» پرداخته که با هدف آزمایش محدودیت‌های مدل‌های زبانی بزرگ (LLM) مانند ChatGPT، به‌صورت دستی و غیرمخرب تلاش می‌کنند این سیستم‌ها را وادار به ارائه پاسخ‌های غیرمجاز یا غیرمنتظره کنند.

این پژوهش که با مصاحبه عمیق با ۲۸ فرد فعال در این حوزه انجام شده، نشان می‌دهد که این فعالیت ترکیبی از کنجکاوی، خلاقیت و همکاری جمعی است و اغلب با انگیزه‌های غیرمخرب و برای شناسایی نقاط ضعف سیستم‌ها صورت می‌گیرد.

محققان با استفاده از روش نظریه‌پردازی داده‌بنیاد، ۳۵ تکنیک نفوذ را در پنج دسته طبقه‌بندی کرده‌اند.

این مطالعه، که توسط «نانا اینیه» از دانشگاه IT کپنهاگ و همکارانش انجام شده، بر اهمیت رویکرد انسان‌محور در امنیت هوش مصنوعی تأکید دارد.

افراد مورد مطالعه، از مهندسان نرم‌افزار تا هنرمندان، در جوامع آنلاین مانند توییتر و دیسکورد با یکدیگر همکاری می‌کنند و از روش‌های خلاقانه‌ای نظیر استفاده از زبان‌های جایگزین یا سناریوهای تخیلی برای دور زدن محدودیت‌های چت‌بات‌ها بهره می‌برند.

نتایج این پژوهش نشان می‌دهد که چنین فعالیت‌هایی، علاوه بر کمک به توسعه سیستم‌های ایمن‌تر، نیاز به درک عمیق‌تر رفتارهای انسانی در تعامل با فناوری‌های پیشرفته را برجسته می‌کند و می‌تواند مبنایی برای تحقیقات آینده در این حوزه باشد.

Adblock test (Why?)

لینک مطلب اصلی

Nobody

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا