اخبار دانش و فناوری
تفاوت فاحش میان ارزیابیهای مستقل مدل o3 و بررسیهای اوپنایآی
مدل هوش مصنوعی جدید شرکت اوپنایآی با نام «o3» که به تازگی از سوی این شرکت معرفی شده است، از لحاظ عملکردی در ارزیابیهای مستقل اختلاف فاحشی با بررسیهای داخلی شرکت دارد. این شرکت در زمان معرفی مدل در ماه دسامبر مدعی شده بود که این مدل توانسته بیش از یکچهارم از مسائل مجموعه FrontierMath را که یک مجموعه از مسائل دشوار ریاضی برای ارزیابی توان استدلالی مدلها است، را حل کند. با این حال بررسیهای مستقل رقمهایمتفاوتی را گزارش کردهاند.