اخبار دانش و فناوری

ChatGPT حالا می‌تواند با مدل GPT-4o تصاویر بهتری تولید کند

OpenAI ویژگی جدیدی با نام «Images in ChatGPT» به چت‌بات خود اضافه کرده و از GPT-4o برای تولید تصویر در این چت‌بات استفاده می‌کند. این قابلیت دقت رنگ‌های تصاویر و رندر متن در تصاویر را تا حد قابل‌‌توجهی بهبود می‌دهد.

به‌ گفته «تارا کریستینسن»، سخنگوی OpenAI ویژگی جدید از امروز در دسترس همه کاربران قرار می‌گیرد. او افزود کاربران نسخه عادی ChatGPT باوجود بعضی محدودیت‌ها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. البته ممکن است این محدودیت‌ها نیز به‌مرور براساس تقاضا یا استقبال کاربران تغییر کند.

قابلیت جدید ChatGPT تصاویر را یکپارچه‌تر می‌کند

«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در گفتگو با Verge از نتایج مثبت این ویژگی گفت. او اشاره کرد از مدل «GPT-4o omnimodal» برای پردازش و توسعه این قابلیت استفاده شده است؛ مدلی که توانایی پردازش انواع مختلف داده‌‌ها را دارد.

او همچنین از بهبود قابل‌توجه ویژگی «Binding» در ساخت تصاویر گفت: «مدل‌های قدیمی اغلب در حفظ انسجام تصاویر مشکل داشتند، مخصوصاً زمانی که عناصر بیشتری را به عکس‌ها اضافه می‌کردیم.» مثلاً ممکن بود مدل هوش مصنوعی به‌جای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.

این مشکل در ChatGPT رفع شده و مدل جدید می‌تواند بین ۱۵ تا ۲۰ عنصر را به‌درستی در عکس قرار دهد اما مدل‌های قدیمی فقط می‌توانستند 5 تا 8 عنصر را بدون اشتباه تولید کنند.

عکس ساخته‌شده با Images in ChatGPT

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» استفاده می‌کند؛ یعنی ChatGPT مثل نوشتن متون تصاویر را تدریجی از بالا به پایین و از چپ به راست می‌سازد. درحالی‌که مدل‌های قبلی مثل DALL·E براساس روش Diffusion model کل تصویر را هم‌زمان پردازش و طراحی می‌کردند. همین موضوع احتمالاً باعث شده تا یکپارچگی تصاویر بهبود یابد.

مدیر تیم تحقیقاتی OpenAI قابلیت جدید ChatGPT را نتیجه تست‌های متعدد و بعضاً تکراری تیمش در ماه‌های اخیر می‌داند. البته او گفت این ویژگی هنوز در پردازش متون ریز و کوچک در تصاویر مشکل دارد اما درمجموع کیفیت متن و تصاویر را هم‌زمان حفظ می‌کند.

Adblock test (Why?)

لینک منبع خبر

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x