هوش مصنوعی گوگل جمنای حالا آهنگ‌سازی می‌کند!

زمان مورد نیاز برای مطالعه: ۲ دقیقه
جمنای

شرکت گوگل در ادامه‌ی روند پرشتاب توسعه‌ی ابزارهای هوش مصنوعی مولد، سرانجام قابلیت مورد انتظار تولید موسیقی را به صورت عمومی عرضه کرد. این ویژگی جدید که بر پایه‌ی مدل قدرتمند Lyria 3 بنا شده است، هم‌اکنون از طریق اپلیکیشن جمنای در دسترس کاربران قرار دارد. گوگل دیپ‌مایند (Google DeepMind) این مدل را پیشرفته‌ترین دستاورد خود در حوزه‌ی موسیقی معرفی کرده که قادر است با درک عمیق از دستورات کاربر، قطعاتی خلاقانه و شنیدنی تولید کند. این حرکت تازه نشان‌دهنده‌ی تلاش گوگل برای تبدیل کردن دستیار هوشمند خود به یک پلتفرم چندمنظوره است که علاوه بر متن و تصویر، اکنون دنیای صدا را نیز به تسخیر خود درآورده است.

در سیستم جدید، فرآیند خلق موسیقی بسیار ساده‌تر و هوشمندتر از گذشته شده است. برخلاف ابزارهای پیشین که نیازمند وارد کردن متن ترانه توسط کاربر بودند، مدل Lyria 3 می‌تواند بر اساس حال‌وهوا و موضوعی که شما توصیف می‌کنید، به صورت خودکار شعر و لیریک مناسب را بنویسد و اجرا کند. کاربران می‌توانند در بخش ابزارهای اپلیکیشن، گزینه‌ی موسیقی را انتخاب کرده و با تعیین سبک، سرعت (Tempo) و نوع وکال، یک قطعه‌ی 30 ثانیه‌ای باکیفیت دریافت کنند. نکته‌ی جالب توجه اینجاست که برای افزایش جذابیت بصری فایل‌های خروجی، مدل دیگری به نام Nano Banana به کار گرفته شده است تا به صورت هم‌زمان یک کاور هنری (Cover Art) اختصاصی و مرتبط برای هر آهنگ تولید کند.

جمنای

گوگل در طراحی قابلیت‌های موزیکال جمنای، راه‌های متنوعی برای تعامل خلاقانه در نظر گرفته است. علاوه بر دستورات متنی که می‌توانند شامل جزئیاتی دقیق مثل «یک آهنگ نوستالژیک با حال‌وهوای آفریقایی» باشند، کاربران امکان آپلود عکس یا ویدیو را نیز به عنوان ورودی دارند. برای مثال، می‌توانید تصویری از حیوان خانگی خود در جنگل بارگذاری کنید و از هوش مصنوعی بخواهید آهنگی متناسب با آن فضا بسازد. با این حال، گوگل تأکید کرده که هدف از این ابزار خلق شاهکارهای هنری نیست، بلکه ایجاد راهی سرگرم‌کننده برای بیان احساسات است. همچنین فیلترهای سخت‌گیرانه‌ای اعمال شده تا از تقلید مستقیم صدای خوانندگان مشهور جلوگیری شود؛ اگر نام هنرمندی ذکر شود، سیستم تنها از سبک کلی او الهام می‌گیرد.

از نظر ایمنی و رعایت حقوق مولفین، تمامی فایل‌های صوتی تولیدشده توسط این هوش مصنوعی به واترمارک دیجیتالی و نامرئی SynthID مجهز هستند تا تشخیص آن‌ها از آثار واقعی برای ابزارهای تشخیصی ممکن باشد. در حال حاضر، این سرویس برای تمامی کاربران بالای 18 سال در زبان‌هایی نظیر انگلیسی، آلمانی، ژاپنی و هندی فعال شده است. اگرچه دسترسی پایه برای عموم رایگان است، اما مشترکین طرح‌های پیشرفته مانند AI Premium محدودیت کمتری در تعداد دفعات تولید محتوا خواهند داشت. گوگل وعده داده است که در آینده‌ای نزدیک، دامنه‌ی زبان‌های پشتیبانی‌شده و کیفیت خروجی را در پلتفرم جمنای به شکل چشمگیری گسترش خواهد داد.

منبع: GSMArena

برچسب‌ها :
دیدگاه شما

پرسش امنیتی *-- بارگیری کد امنیتی --

بازدیدهای اخیر

بر اساس بازدیدهای اخیر شما
تاریخچه بازدیدها مشاهده همه

دسته‌بندی‌های منتخب برای شما

X