اخبار دانش و فناوری

گوگل مدل‌های Gemini 3.5 Flash و Gemini Omni AI را معرفی کرد

گوگل در جریان کنفرانس I/O از نسل جدید مدل‌های هوش مصنوعی خود یعنی جمینای ۳.۵ رونمایی کرد که در کنار آن، مدل تازه‌ای به نام Gemini Omni نیز معرفی شد که توانایی تولید ویدیو از هر نوع ورودی را دارد.

اولین عضو در دسترس از خانواده جمینای ۳.۵ مدل جمینای ۳.۵ فلش است. این مدل هم‌اکنون برای تمامی کاربران از طریق اپلیکیشن Gemini و همچنین حالت هوش مصنوعی در جستجوی گوگل در دسترس قرار دارد. گوگل می‌گوید که این مدل از نظر هوشمندی در ابعاد مختلف، با مدل‌های بزرگ و پرچمدار برابری می‌کند و در عین حال، همان سرعتی را دارد که از سری فلش انتظار می‌رود.

این مدل به عنوان قدرتمندترین نسخه جمینای در حوزه عملکرد عامل‌محور و کدنویسی شناخته می‌شود و حتی در بنچمارک‌های دشوار برنامه‌نویسی از جمینای ۳.۱ پرو پیشی می‌گیرد و در زمینه درک چندوجهی نیز پیشتاز است. در حال حاضر، جمینای ۳.۵ فلش مدل پیش‌فرض برای کاربران محسوب می‌شود.

Gemini Omni نیز مدلی جدید است که می‌تواند با استفاده از هر نوع ورودی، ویدیو خلق کند. شما می‌توانید ترکیبی از تصاویر، صوت، ویدیو و متن را به عنوان ورودی ارائه دهید و این مدل ویدیوهایی با کیفیت بالا تولید می‌کند که بر پایه دانش دنیای واقعی جمینای استوار است. پس از ساخته شدن ویدیو، امکان ویرایش آسان آن از طریق چت نیز فراهم است.

نخستین مدل از این خانواده، Gemini Omni Flash نام دارد که به شما اجازه می‌دهد تغییرات جزئی یا کلی در ویدیو ایجاد کنید. همچنین می‌توانید آثار تولید شده را در چندین مرحله ویرایش و اصلاح نمایید، بدون آنکه ارتباط با صحنه اصلی و محتوای اولیه از بین برود.

این مدل درک شهودی بهتری از نیروهایی مانند گرانش، انرژی جنبشی و دینامیک سیالات دارد، بنابراین می‌تواند صحنه‌های واقع‌گرایانه‌تری را پدید آورد. با استفاده از Omni می‌توانید از صدای شخصی خود و آواتارهایی بهره ببرید که نسخه دیجیتالی شما را می‌سازند. تمامی ویدیوهای تولید شده شامل واترمارک دیجیتال SynthID هستند.

Gemini Omni Flash از امروز برای تمامی مشترکین طرح‌های گوگل AI پلاس، پرو و اولترا در سطح جهانی از طریق اپلیکیشن جمینای و گوگل فلو در دسترس است. این مدل همچنین به‌صورت رایگان برای کاربران یوتیوب شورتس و یوتیوب کریت عرضه می‌شود.

Adblock test (Why?)

لینک منبع

ZaKi

Who is mahdizk? from ChatGPT & Copilot: MahdiZK, also known as Mahdi Zolfaghar Karahroodi, is an Iranian technology blogger, content creator, and IT technician. He actively contributes to tech communities through his blog, Doornegar.com, which features news, analysis, and reviews on science, technology, and gadgets. Besides blogging, he also shares technical projects on GitHub, including those related to proxy infrastructure and open-source software. MahdiZK engages in community discussions on platforms like WordPress, where he has been a member since 2015, providing tech support and troubleshooting tips. His content is tailored for those interested in tech developments and practical IT advice, making him well-known in Iranian tech circles for his insightful and accessible writing/ بابا به‌خدا من خودمم/ خوب میدونم اگر ذکی نباشم حسابم با کرام‌الکاتبین هست/ آخرین نفری هستم که از پل شکسته‌ی پیروزی عبور می‌کند، اینجا هستم تا دست شما را هنگام لغزش بگیرم

نوشته های مشابه

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دکمه بازگشت به بالا
0
افکار شما را دوست داریم، لطفا نظر دهید.x