گوگل با مدل هوش مصنوعی Gemini Omni بازار تولید ویدیو را متحول می‌کند

یوسف اسفندیاری

۳۰ اردیبهشت ۱۴۰۵ | ۰۸:۰۰ زمان مورد نیاز برای مطالعه: ۱ دقیقه

گوگل در جریان رویداد سالانه‌ی توسعه‌دهندگان خود، Google I/O 2026، از خانواده‌ی جدید مدل‌های هوش مصنوعی با نام مدل Gemini Omni رونمایی کرد. این فناوری پیشرفته با شعار «خلق هر چیز از هر ورودی» طراحی شده و در گام نخست، امکان تولید ویدیوهایی به‌شدت واقع‌گرایانه را برای کاربران فراهم آورده است. گوگل پیش از این با پروژه‌هایی مانند جینی (Genie)، ویو (Veo) و نانو بنانا گام‌هایی را در مسیر شبیه‌سازی جهان فیزیکی برداشته بود؛ اما مدل جدید با درک چندوجهی عمیق‌تر، این فرآیند را به سطح جدیدی ارتقا می‌دهد.

مدل Gemini Omni قادر است متن، تصاویر، ویدیوها و نمونه‌های صوتی را ترکیب کرده و یک خروجی ویدیویی یکپارچه و هماهنگ تولید کند. کاربران پس از ساخت ویدیو می‌توانند با دستورهای بعدی، جزئیات آن را ویرایش و اصلاح کنند. پیش‌نمایش‌های منتشرشده از عملکرد این مدل، هماهنگی بی‌نظیر قوانین فیزیکی و صداگذاری دقیق حرکت اشیاء را نشان می‌دهند. بر خلاف مدل جینی که منحصر به مشترکین گران‌قیمت‌تر است، گوگل این فناوری را با دسترسی گسترده‌تری عرضه می‌کند. نسخه‌ی سبک‌تر این خانواده با نام فلش در اختیار مشترکین سرویس‌های پلاس قرار گرفته است و نسخه‌ی رایگان آن نیز به‌زودی در پلتفرم‌های یوتیوب شورتس و یوتیوب کریت فعال می‌شود. گوگل همچنین به عرضه‌ی نسخه‌ی پیشرفته‌تر موسوم به پرو در آینده‌ی نزدیک اشاره کرده است.

با توجه به واقع‌گرایی بالای ویدیوهای تولیدی، گوگل تدابیر امنیتی ویژه‌ای را برای استفاده‌ی مسئولانه از این ابزار اتخاذ کرده است. کاربران برای حضور در ویدیوها می‌توانند آواتار اختصاصی خود را بسازند و تا زمان حل چالش‌های امنیتی، قابلیت ویرایش آزادانه صدا و گفتار محدود خواهد بود. علاوه بر این، تمامی خروجی‌های مدل Gemini Omni به واترمارک نامرئی SynthID مجهز خواهند شد تا شناسایی محتوای ساخته‌شده با هوش مصنوعی به‌سادگی امکان‌پذیر باشد.

خرید گوشی از دیجی‌کالا

مشاهده همه