گوگل مدلهای Gemini 3.5 Flash و Gemini Omni AI را معرفی کرد

گوگل در جریان کنفرانس I/O از نسل جدید مدلهای هوش مصنوعی خود یعنی جمینای ۳.۵ رونمایی کرد که در کنار آن، مدل تازهای به نام Gemini Omni نیز معرفی شد که توانایی تولید ویدیو از هر نوع ورودی را دارد.
اولین عضو در دسترس از خانواده جمینای ۳.۵ مدل جمینای ۳.۵ فلش است. این مدل هماکنون برای تمامی کاربران از طریق اپلیکیشن Gemini و همچنین حالت هوش مصنوعی در جستجوی گوگل در دسترس قرار دارد. گوگل میگوید که این مدل از نظر هوشمندی در ابعاد مختلف، با مدلهای بزرگ و پرچمدار برابری میکند و در عین حال، همان سرعتی را دارد که از سری فلش انتظار میرود.
این مدل به عنوان قدرتمندترین نسخه جمینای در حوزه عملکرد عاملمحور و کدنویسی شناخته میشود و حتی در بنچمارکهای دشوار برنامهنویسی از جمینای ۳.۱ پرو پیشی میگیرد و در زمینه درک چندوجهی نیز پیشتاز است. در حال حاضر، جمینای ۳.۵ فلش مدل پیشفرض برای کاربران محسوب میشود.
Gemini Omni نیز مدلی جدید است که میتواند با استفاده از هر نوع ورودی، ویدیو خلق کند. شما میتوانید ترکیبی از تصاویر، صوت، ویدیو و متن را به عنوان ورودی ارائه دهید و این مدل ویدیوهایی با کیفیت بالا تولید میکند که بر پایه دانش دنیای واقعی جمینای استوار است. پس از ساخته شدن ویدیو، امکان ویرایش آسان آن از طریق چت نیز فراهم است.
نخستین مدل از این خانواده، Gemini Omni Flash نام دارد که به شما اجازه میدهد تغییرات جزئی یا کلی در ویدیو ایجاد کنید. همچنین میتوانید آثار تولید شده را در چندین مرحله ویرایش و اصلاح نمایید، بدون آنکه ارتباط با صحنه اصلی و محتوای اولیه از بین برود.
این مدل درک شهودی بهتری از نیروهایی مانند گرانش، انرژی جنبشی و دینامیک سیالات دارد، بنابراین میتواند صحنههای واقعگرایانهتری را پدید آورد. با استفاده از Omni میتوانید از صدای شخصی خود و آواتارهایی بهره ببرید که نسخه دیجیتالی شما را میسازند. تمامی ویدیوهای تولید شده شامل واترمارک دیجیتال SynthID هستند.
Gemini Omni Flash از امروز برای تمامی مشترکین طرحهای گوگل AI پلاس، پرو و اولترا در سطح جهانی از طریق اپلیکیشن جمینای و گوگل فلو در دسترس است. این مدل همچنین بهصورت رایگان برای کاربران یوتیوب شورتس و یوتیوب کریت عرضه میشود.