قابلیت هوش مصنوعی گرافیک‌های RDNA 3 و NPU XDNA شرکت AMD!

شرکت AMD این بار داده‌های جالبی را در مورد قابلیت‌های سخت‌افزار گرافیک RDNA 3 و XDNA NPU خود در بارهای کاری هوش مصنوعی مصرف‌کننده محور به اشتراک گذاشته است.

بر اساس این اطلاعات، گرافیک‌های RDNA 3 و NPU XDNA شرکت AMD مجموعه‌ای قوی از قابلیت‌های هوش مصنوعی مبتنی بر مصرف‌کننده را در پلتفرم‌های PC ارائه می‌کنند.

شکی نیست که شرکت AMD در ارائه گسترده‌تر قابلیت‌های هوش مصنوعی به مخاطبان PCها از طریق پیاده‌سازی XDNA NPU بر روی APUهای Ryzen خود پیشتاز بوده است. اولین NPU در سال ۲۰۲۳ با APUهای Phoenix Ryzen 7040 به بازار عرضه شد و به تازگی با سری Hawk Point Ryzen 8040 آپدیت شده است. علاوه بر NPU، معماری پردازنده گرافیکی RDNA 3 شرکت AMD تعداد زیادی از هسته‌های هوش مصنوعی اختصاصی را نیز در خود جای داده است که می‌توانند این حجم‌های کاری را مدیریت کنند. علاوه بر این شرکت AMD در تلاش است تا با ارائه مجموعه نرم‌افزاری ROCm حرکت خود را تقویت کند.

در طی آخرین وبینار Meet The Experts، شرکت AMD در مورد اینکه چگونه مجموعه کارت گرافیک‌های Radeon خود مانند سری RDNA 3 طیف وسیعی از بارهای کاری بهینه شده را در اختیار گیمرها، سازندگان و توسعه دهندگان قرار می‌دهد، بحث کرد:

  • افزایش کیفیت ویدیو
  • حذف نویز پس زمینه
  • متن به تصویر (GenAI)
  • مدل‌های زبان بزرگ (GenAI)
  • ویرایش عکس
  • ویراش ویدیو
  • ارتقاء مقیاس
  • تبدیل متن به تصویر
  • آموزش مدل (لینوکس)
  • بستر ROCm (لینوکس)
قابلیت هوش مصنوعی گرافیک‌های RDNA 3 و NPU XDNA شرکت AMD!

با ظهور معماری گرافیکی AMD RDNA 3، آخرین چیپ‌های گرافیکی که در کارت گرافیک‌های Radeon RX 7000 و پردازنده‌های Ryzen 7000/8000 ارائه می‌شوند، بیش از ۲ برابر افزایش عملکرد هوش مصنوعی نسل به نسل را ارائه می‌کنند.

این محصولات گرافیکی حداکثر ۱۹۲ شتاب دهنده هوش مصنوعی را ارائه می‌دهند که برای بارهای کاری FP16 در چارچوب‌های ML متعدد مانند Microsoft DirectML، Nod.AI Shark و ROCm بهینه شده‌اند و دارای ظرفیت‌های بزرگی از VRAM اختصاصی هستند که برای مدیریت مجموعه داده‌های بزرگ (تا ۴۸ گیگابایت) ضروری خواهد بود. همچنین از پهنای باند سریع تر پشتیبانی می‌کند که با فناوری Infinity Cache تقویت شده است.

به گفته شرکت AMD، اکثر موارد استفاده از هوش مصنوعی در پلتفرم PCها شامل مدل‌های LLM و Diffusion خواهند بود که عمدتاً به محاسبات FP16 و قابلیت‌های حافظه سخت‌افزاری که روی آن اجرا می‌شوند وابسته هستند. مدل‌های خاصی مانند SDXL (Diffusion) توسط Compute محدود می‌شوند و به حدود ۴-۱۶ گیگابایت حافظه نیاز دارند در حالی که Llama2-13B و Mistral-8x 7B توسط حافظه محدود شده‌اند و می‌توانند حداکثر ۲۳ گیگابایت حافظه را اشغال کنند.

همانطور که قبلا ذکر شد، کمپانی AMD دارای طیف گسترده‌ای از سخت افزار است که از شتاب هوش مصنوعی اختصاصی پشتیبانی می‌کنند. حتی کارت گرافیک‌های Radeon RX 7600 XT این شرکت، که یک نسخه ۳۲۹ دلاری محسوب می‌شود، دارای ۱۶ گیگابایت VRAM است و از نظر عملکرد، افزایش ۳.۶ برابری نسبت به Ryzen 7 8700G در LM Studio ارائه می‌دهد در حالی که نسخه RX 7900 XT تا ۸ برابر سریعتر از مدل ۸۷۰۰G است.

عملکرد LM Studio (بالاتر بهتر است):

  • NPU Ryzen 7 8700G: برابر با ۱۱ توکن در ثانیه
  • RX 7600 XT 16 GB: برابر با ۴۰ توکن در ثانیه
  • RX 7900 XT 20 GB: برابر با ۸۵ توکن در ثانیه

AMUSE Diffusion (کمتر بهتر است):

  • NPU Ryzen 7 8700G: برابر با ۲.۶ ثانیه/تصویر
  • RX 7600 XT 16 GB: برابر با ۰.۹۷ ثانیه/تصویر
  • RX 7900 XT 20 GB: برابر با ۰.۶ ثانیه/تصویر

شرکت AMD همچنین مقایسه کوچکی با کارت گرافیک‌های GeForce RTX انجام می‌دهد که شرکت انویدیا آن را پلتفرم Premium AI PC می‌نامد. هر دو سری پشتیبانی مشابهی ارائه می‌کنند، اما شرکت AMD نشان می‌دهد که چگونه کارت گرافیک ۱۶ گیگابایتی آن‌ها با قیمت ۳۲۹ دلار (یعنی نسخه ۷۶۰۰ XT) به بازار عرضه می‌شوند، در حالی که بها تمام شده پایین رده‌ترین کارت گرافیک کمپانی انویدیا با ظرفیت ۱۶ گیگابایت از حدود ۵۰۰ دلار آمریکا (یعنی نسخه ۴۰۶۰ TI 16 GB) شروع می‌شود. این شرکت همچنین دارای یک محصول رده بالا است که تا ۴۸ گیگابایت حافظه را پشتیبانی می‌کند. همچنین شرکت AMD قبلاً عملکرد قوی‌تری در برابر پردازنده‌های Core Ultra کمپانی اینتل در هوش مصنوعی، با قیمت بهتر نشان داده است.

در حرکت رو به جلو، شرکت AMD در مورد چگونگی پیشرفت ROCm 6.0 و نحوه پشتیبانی پکیج‌های منبع باز از سخت افزارهای سطح مصرف کننده مانند Radeon RX 7900 XTX، ۷۹۰۰ XT، ۷۹۰۰ GRE، PRO W7900 و PRO W7800 صحبت می‌کند. ROCm 6.0 از مدل‌ها و الگوریتم‌های PyTorch و ONNX Runtime ML در سیستم‌عامل Ubuntu 22.03.3 (Linux) پشتیبانی خواهد کرد و با افزودن INT8 برای مدل‌های پیچیده‌تر، قابلیت همکاری را بهبود می‌بخشد.

این شرکت همچنین در تلاش است تا ROCm را با ارائه مجموعه‌ای از پکیج‌های نرم‌افزار و اسناد سخت‌افزاری به توسعه دهندگان، منبع بازتر کند.

شرکت AMD و مجموعه ROCm آن در حال رقابت با پکیج غالب CUDA و TensorRT کمپانی انویدیا هستند در حالی که اینتل نیز با پکیج OneAPI AI خود در حال پیشرفت است. اینها سه نیرویی هستند که باید در مورد بارهای کاری هوش مصنوعی در پلتفرم PC به آنها توجه کنید، بنابراین در آینده منتظر نوآوری‌ها و بهینه سازی‌های زیادی برای سخت افزارهای موجود و نسل بعدی باشید.

مطالب مرتبط:

Adblock test (Why?)

منبع خبر


دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.