گوگل با مدل هوش مصنوعی Gemini Omni بازار تولید ویدیو را متحول میکند
گوگل در جریان رویداد سالانهی توسعهدهندگان خود، Google I/O 2026، از خانوادهی جدید مدلهای هوش مصنوعی با نام مدل Gemini Omni رونمایی کرد. این فناوری پیشرفته با شعار «خلق هر چیز از هر ورودی» طراحی شده و در گام نخست، امکان تولید ویدیوهایی بهشدت واقعگرایانه را برای کاربران فراهم آورده است. گوگل پیش از این با پروژههایی مانند جینی (Genie)، ویو (Veo) و نانو بنانا گامهایی را در مسیر شبیهسازی جهان فیزیکی برداشته بود؛ اما مدل جدید با درک چندوجهی عمیقتر، این فرآیند را به سطح جدیدی ارتقا میدهد.
مدل Gemini Omni قادر است متن، تصاویر، ویدیوها و نمونههای صوتی را ترکیب کرده و یک خروجی ویدیویی یکپارچه و هماهنگ تولید کند. کاربران پس از ساخت ویدیو میتوانند با دستورهای بعدی، جزئیات آن را ویرایش و اصلاح کنند. پیشنمایشهای منتشرشده از عملکرد این مدل، هماهنگی بینظیر قوانین فیزیکی و صداگذاری دقیق حرکت اشیاء را نشان میدهند. بر خلاف مدل جینی که منحصر به مشترکین گرانقیمتتر است، گوگل این فناوری را با دسترسی گستردهتری عرضه میکند. نسخهی سبکتر این خانواده با نام فلش در اختیار مشترکین سرویسهای پلاس قرار گرفته است و نسخهی رایگان آن نیز بهزودی در پلتفرمهای یوتیوب شورتس و یوتیوب کریت فعال میشود. گوگل همچنین به عرضهی نسخهی پیشرفتهتر موسوم به پرو در آیندهی نزدیک اشاره کرده است.
با توجه به واقعگرایی بالای ویدیوهای تولیدی، گوگل تدابیر امنیتی ویژهای را برای استفادهی مسئولانه از این ابزار اتخاذ کرده است. کاربران برای حضور در ویدیوها میتوانند آواتار اختصاصی خود را بسازند و تا زمان حل چالشهای امنیتی، قابلیت ویرایش آزادانه صدا و گفتار محدود خواهد بود. علاوه بر این، تمامی خروجیهای مدل Gemini Omni به واترمارک نامرئی SynthID مجهز خواهند شد تا شناسایی محتوای ساختهشده با هوش مصنوعی بهسادگی امکانپذیر باشد.
منبع: 9To5Google
