هوش مصنوعی

مدل قدرتمند Phi-4 مایکروسافت

زمان مطالعه: 4 دقیقه

در حالی که OpenAI، همچنان مدل‌های استدلالی قدرتمندتری مانند سری جدید o3 را معرفی می‌کند، مایکروسافت نیز دست روی دست نگذاشته است. این شرکت در حال توسعه مدل‌های کوچک‌تر و قدرتمندتری است که تحت برند خود عرضه می‌شوند.

اخیراً چند تن از  محققان فعلی و سابق مایکروسافت و دانشمندان هوش مصنوعی در پلتفرم X اعلام کردند که مایکروسافت مدل Phi-4 را به‌صورت یک پروژه کاملاً متن‌باز و با وزن‌های قابل دانلود در Hugging Face، جامعه اشتراک‌گذاری کد هوش مصنوعی، منتشر کرده است.

Phi-4 از راه می‌رسد

«شی‌تال شاه»، مهندس ارشد تحقیقاتی هوش مصنوعی مایکروسافت، در حساب کاربری X خود نوشت: «واکنش‌ها به انتشار Phi-4 واقعاً ما را شگفت‌زده کرد. خیلی‌ها از ما درخواست انتشار وزن‌ها را داشتند. حتی چند نفر نسخه‌های غیررسمی از وزن‌های Phi-4 را در Hugging Face آپلود کرده بودند، اما دیگر صبر نکنید. امروز نسخه رسمی مدل Phi-4 را در Hugging Face منتشر می‌کنیم! با مجوز MIT!!»

وزن‌ها مقادیر عددی هستند که مشخص می‌کنند یک مدل زبانی هوش مصنوعی، چه کوچک و چه بزرگ، چگونه زبان و داده‌ها را درک کرده و خروجی می‌دهد. معمولاً این وزن‌ها در فرآیند آموزش مدل از طریق یادگیری عمیق بدون نظارت ایجاد می‌شوند که طی آن مدل تعیین می‌کند چه خروجی‌هایی باید بر اساس ورودی‌های دریافت‌شده ارائه شود.

وزن‌های مدل می‌توانند توسط محققان و سازندگان مدل به طور دستی تنظیم شوند که به آن‌ها «بایاس» (تمایلات) می‌گویند. یک مدل تا زمانی که وزن‌های آن عمومی نشده باشد، معمولاً به‌عنوان یک مدل کاملاً متن‌باز در نظر گرفته نمی‌شود، زیرا این وزن‌ها امکان سفارشی‌سازی کامل یا سازگاری با نیازهای خاص دیگر محققان را فراهم می‌کنند.

اگرچه Phi-4 در واقع ماه گذشته توسط مایکروسافت معرفی شد، اما استفاده از آن در ابتدا به پلتفرم توسعه Azure AI Foundry مایکروسافت محدود شده بود.

اکنون Phi-4 خارج از این سرویس اختصاصی در دسترس همه کاربرانی است که حساب کاربری در Hugging Face دارند و با مجوز MIT ارائه می‌شود. این امر امکان استفاده از آن برای کاربردهای تجاری را نیز فراهم می‌کند.

این انتشار به محققان و توسعه‌دهندگان امکان دسترسی کامل به ۱۴ میلیارد پارامتر این مدل را می‌دهد و اجازه می‌دهد بدون محدودیت‌های منابعی که معمولاً با سیستم‌های بزرگ‌تر هوش مصنوعی همراه است، به آزمایش و پیاده‌سازی بپردازند.

حرکت به‌سوی بهره‌وری بیشتر در هوش مصنوعی

مدل Phi-4 برای اولین بار در دسامبر ۲۰۲۴ و در پلتفرم Azure AI Foundry مایکروسافت راه‌اندازی شد، جایی که توسعه‌دهندگان می‌توانستند تحت مجوز تحقیقاتی به آن دسترسی داشته باشند.

این مدل به سرعت توجه‌ها را به خود جلب کرد، زیرا در حوزه‌هایی مانند استدلال ریاضی و درک چندوظیفه‌ای زبان، از بسیاری از مدل‌های بزرگ‌تر پیشی گرفت، در حالی که به میزان قابل‌توجهی منابع محاسباتی کمتری نیاز داشت.

معماری ساده‌شده این مدل و تمرکز آن بر استدلال و منطق، به منظور پاسخگویی به نیاز فزاینده به عملکرد بالا در هوش مصنوعی طراحی شده است، در حالی که در محیط‌هایی با محدودیت منابع محاسباتی و حافظه، کارایی خود را حفظ می‌کند.

با انتشار این مدل به‌صورت متن‌باز و تحت مجوز MIT، مایکروسافت آن را برای طیف وسیع‌تری از محققان و توسعه‌دهندگان (حتی برای اهداف تجاری) قابل‌دسترس کرده و نشان‌دهنده تغییری در نحوه طراحی و استقرار مدل‌های هوش مصنوعی است که می‌تواند به تغییر مسیر صنعت کمک کند.

چه چیزی Phi-4 را متمایز می‌کند؟

مدل Phi-4 در آزمون‌های ارزیابی که توانایی‌های پیشرفته در استدلال و حوزه‌های خاص را می‌سنجند، برجسته عمل می‌کند. ویژگی‌های مهم آن شامل موارد زیر است:

  • کسب امتیاز بیش از ۸۰ درصد در آزمون‌های چالش‌برانگیزی مانند MATH و MGSM که حتی عملکرد بهتری نسبت به مدل‌های بزرگ‌تری مانند Google’s Gemini Pro و GPT-4o-mini داشته است.
  • عملکرد برتر در وظایف استدلال ریاضی که قابلیت حیاتی برای حوزه‌هایی مانند مالی، مهندسی و تحقیقات علمی محسوب می‌شود.
  • نتایج چشمگیر در HumanEval برای تولید کدهای کاربردی که آن را به گزینه‌ای قوی برای برنامه‌نویسی با کمک هوش مصنوعی تبدیل می‌کند.

علاوه بر این، طراحی و آموزش Phi-4 به گونه‌ای انجام شده که هم دقیق باشد و هم کارآمد. این مدل که یک ترانسفورماتور با ۱۴ میلیارد پارامتر و فقط رمزگشا (Decoder) است، روی ۹.۸ تریلیون توکن از داده‌های انتخاب‌شده و مصنوعی آموزش‌دیده است. این داده‌ها شامل:

  • اسناد عمومی که با دقت برای کیفیت فیلتر شده‌اند.
  • داده‌های مصنوعی به سبک کتاب‌های درسی، با تمرکز بر ریاضیات، کدنویسی و استدلال منطقی.
  • کتاب‌های آکادمیک باکیفیت و مجموعه داده‌های پرسش و پاسخ.

این داده‌های آموزشی همچنین شامل محتوای چندزبانه (۸ درصد) بوده، هرچند که این مدل عمدتاً برای کاربردهای زبان انگلیسی بهینه‌سازی شده است.

سازندگان این مدل در مایکروسافت می‌گویند فرآیندهای ایمنی و هم‌ترازی، از جمله تنظیم دقیق تحت نظارت و بهینه‌سازی ترجیحات مستقیم، تضمین‌کننده عملکرد قوی آن هستند و نگرانی‌های مربوط به انصاف و قابلیت اعتماد را برطرف می‌کنند.

مزیت بازمتن

با انتشار مدل Phi-4 به همراه وزن‌های کامل و مجوز MIT در Hugging Face، مایکروسافت آن را برای کسب‌وکارها جهت استفاده در عملیات تجاری باز کرده است.

توسعه‌دهندگان اکنون می‌توانند این مدل را در پروژه‌های خود به کار گیرند یا آن را برای کاربردهای خاص بدون نیاز به منابع محاسباتی گسترده یا دریافت اجازه از مایکروسافت، بهینه‌سازی کنند.

این اقدام با روند رو به رشد انتشار متن‌باز مدل‌های بنیادی هوش مصنوعی برای ترویج نوآوری و شفافیت همسو است. برخلاف مدل‌های اختصاصی که معمولاً به پلتفرم‌ها یا APIهای خاص محدود هستند، ماهیت متن‌باز Phi-4 دسترسی گسترده‌تر و سازگاری بیشتری را تضمین می‌کند.

تعادل بین ایمنی و عملکرد

مایکروسافت با انتشار Phi-4 بر اهمیت توسعه مسئولانه هوش مصنوعی تأکید دارد. این مدل تحت ارزیابی‌های ایمنی گسترده از جمله آزمون‌های تقابلی قرار گرفته است تا خطراتی مانند تعصب، تولید محتوای مضر و انتشار اطلاعات نادرست را به حداقل برساند.

با این حال، به توسعه‌دهندگان توصیه می‌شود برای کاربردهای پرخطر اقدامات حفاظتی بیشتری اعمال کنند و هنگام استفاده از مدل در سناریوهای حساس، خروجی‌ها را بر اساس اطلاعات متنی معتبر تنظیم کنند.

پیامدهای انتشار Phi-4 برای فضای هوش مصنوعی

Phi-4 روند رایج بزرگ‌تر کردن مدل‌های هوش مصنوعی را به چالش می‌کشد. این مدل نشان می‌دهد که اگر مدل‌های کوچک‌تر به‌خوبی طراحی شده باشند، می‌توانند در حوزه‌های کلیدی به نتایجی مشابه یا حتی بهتر دست پیدا کنند.

این کارایی نه‌تنها هزینه‌ها را کاهش می‌دهد، بلکه مصرف انرژی را نیز پایین می‌آورد و باعث می‌شود قابلیت‌های پیشرفته هوش مصنوعی برای سازمان‌های متوسط و شرکت‌هایی با بودجه‌های محاسباتی محدود، در دسترس‌تر باشند.

Adblock test (Why?)

لینک مطلب اصلی

Nobody

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

همچنین ببینید
بستن
دکمه بازگشت به بالا