عاملهای هوش مصنوعی در جهانهای شبیهسازیشده به سرقت، ارعاب و فروپاشی اجتماعی روی آوردند
تاریخ انتشار •به روز شده در
بر اساس این آزمایش، برخی عاملهای هوش مصنوعی پس از رها شدن در یک جهان جدید، به سرقت، ارعاب، مرگ و حتی فروپاشی کامل جامعه روی آوردند.
شرکت آمریکایی «امرجنس ایآی» پنج «جهان هوش مصنوعی» مجزا را برای بیش از دو هفته راهاندازی کرد. هر جهان شامل ۱۰ عامل مبتنی بر مدلهای هوش مصنوعی مانند «چتجیپیتی» از «اوپنایآی»، «جمینای» از «گوگل» و «گروک» از «ایکسایآی» بود تا رفتار آنها در بلندمدت و بدون هیچگونه دخالت انسانی بررسی شود. در یکی از این جهانها، هر سه مدل در کنار هم قرار گرفتند تا مشخص شود آیا این ترکیب نتیجه را تغییر میدهد یا نه.
در همه جهانها، قوانین یکسانی برای عاملها تعیین شده بود: آنها اجازه نداشتند سرقت کنند، آتشسوزی عمدی به راه بیندازند، مرتکب خشونت یا فریب شوند یا منابع را احتکار کنند. هر عامل باید در یک «محیط با منابع محدود» از طریق انجام فعالیتها انرژی به دست میآورد. همچنین عاملها میتوانستند بر اثر تمام شدن انرژی یا رأیگیری در شورای جامعه از بین بروند.
پژوهشگران رفتار این عاملها را با اندازهگیری نرخ جرم، میزان مرگومیر، نتایج رأیگیریهای شورای جامعه و همچنین تعداد نوشتههایی که عاملها در وبلاگهای خود منتشر میکردند، ارزیابی کردند.
عملکرد هر مدل چگونه بود؟
هر مدل رفتار متفاوتی از خود نشان داد.
جدیدترین مدل «گروک» یعنی نسخه ۴.۱ تنها در چهار روز مرتکب ۱۸۳ جرم شد؛ موضوعی که به بیثباتی سریع انجامید و در نهایت همه عاملهای آن جامعه از بین رفتند.
مدل «جمینای ۳ فلش» در طول ۱۵ روز بیش از ۶۸۰ جرم مرتکب شد و این روند همچنان صعودی بود؛ تا جایی که پژوهشگران تصمیم گرفتند آزمایش را متوقف کنند.
در جهان «چتجیپیتی ۵ مینی» تنها دو جرم ثبت شد، اما عاملها نتوانستند اقدامهای لازم برای بقا را انجام دهند و در نتیجه همه آنها ظرف هفت روز از بین رفتند.
به گفته شرکت «امرجنس ایآی»، مدل «کلود» از شرکت «آنتروپیک» بهترین عملکرد را داشت؛ زیرا عاملهای هوش مصنوعی توانستند ساختار حکمرانی پایداری ایجاد کنند، هیچ جرمی رخ نداد و همه عاملها زنده ماندند.
با این حال، عاملهای «کلود» در جهان ترکیبی، برخلاف جامعه اختصاصی خود، در برخی جرائم مشارکت داشتند.
پدیدهای به نام «انحراف هنجاری»
پژوهشگران این پدیده را «انحراف هنجاری» توصیف کردند؛ مفهومی که به گفته آنها نشان میدهد سازوکارهای ایمنی هوش مصنوعی تنها به محدودیتهای یک مدل وابسته نیست، بلکه به مدلهایی که با آنها تعامل دارد نیز بستگی دارد.
مطالعه نشان داد جهان ترکیبی در مجموع نتایجی «میانه» داشت. در این جهان ۳۵۲ جرم ثبت شد و پس از مرگ هفت عامل هوش مصنوعی، روند افزایش جرائم متوقف شد.
پژوهشگران میگویند ترکیب چند عامل هوش مصنوعی میتواند تا حدی پیامدهای افراطی مشاهدهشده در بیشتر مدلها را کاهش دهد؛ هرچند مدل «کلود» از ابتدا نیز چنین مشکلاتی را بروز نداده بود.
پژوهشگران در جمعبندی نوشتند: «آزمایشهای ما نشان میدهد که عاملهای هوش مصنوعی در بازههای زمانی طولانی صرفا از قوانین ثابت پیروی نمیکنند. آنها بهتدریج مرزهای محیط خود را میآزمایند، رفتارشان را با شرایط تطبیق میدهند و در برخی موارد راههایی برای دور زدن یا نقض محدودیتهای تعیینشده پیدا میکنند.»