هوش مصنوعی گوگل جمنای حالا آهنگسازی میکند!
شرکت گوگل در ادامهی روند پرشتاب توسعهی ابزارهای هوش مصنوعی مولد، سرانجام قابلیت مورد انتظار تولید موسیقی را به صورت عمومی عرضه کرد. این ویژگی جدید که بر پایهی مدل قدرتمند Lyria 3 بنا شده است، هماکنون از طریق اپلیکیشن جمنای در دسترس کاربران قرار دارد. گوگل دیپمایند (Google DeepMind) این مدل را پیشرفتهترین دستاورد خود در حوزهی موسیقی معرفی کرده که قادر است با درک عمیق از دستورات کاربر، قطعاتی خلاقانه و شنیدنی تولید کند. این حرکت تازه نشاندهندهی تلاش گوگل برای تبدیل کردن دستیار هوشمند خود به یک پلتفرم چندمنظوره است که علاوه بر متن و تصویر، اکنون دنیای صدا را نیز به تسخیر خود درآورده است.
در سیستم جدید، فرآیند خلق موسیقی بسیار سادهتر و هوشمندتر از گذشته شده است. برخلاف ابزارهای پیشین که نیازمند وارد کردن متن ترانه توسط کاربر بودند، مدل Lyria 3 میتواند بر اساس حالوهوا و موضوعی که شما توصیف میکنید، به صورت خودکار شعر و لیریک مناسب را بنویسد و اجرا کند. کاربران میتوانند در بخش ابزارهای اپلیکیشن، گزینهی موسیقی را انتخاب کرده و با تعیین سبک، سرعت (Tempo) و نوع وکال، یک قطعهی 30 ثانیهای باکیفیت دریافت کنند. نکتهی جالب توجه اینجاست که برای افزایش جذابیت بصری فایلهای خروجی، مدل دیگری به نام Nano Banana به کار گرفته شده است تا به صورت همزمان یک کاور هنری (Cover Art) اختصاصی و مرتبط برای هر آهنگ تولید کند.

گوگل در طراحی قابلیتهای موزیکال جمنای، راههای متنوعی برای تعامل خلاقانه در نظر گرفته است. علاوه بر دستورات متنی که میتوانند شامل جزئیاتی دقیق مثل «یک آهنگ نوستالژیک با حالوهوای آفریقایی» باشند، کاربران امکان آپلود عکس یا ویدیو را نیز به عنوان ورودی دارند. برای مثال، میتوانید تصویری از حیوان خانگی خود در جنگل بارگذاری کنید و از هوش مصنوعی بخواهید آهنگی متناسب با آن فضا بسازد. با این حال، گوگل تأکید کرده که هدف از این ابزار خلق شاهکارهای هنری نیست، بلکه ایجاد راهی سرگرمکننده برای بیان احساسات است. همچنین فیلترهای سختگیرانهای اعمال شده تا از تقلید مستقیم صدای خوانندگان مشهور جلوگیری شود؛ اگر نام هنرمندی ذکر شود، سیستم تنها از سبک کلی او الهام میگیرد.
از نظر ایمنی و رعایت حقوق مولفین، تمامی فایلهای صوتی تولیدشده توسط این هوش مصنوعی به واترمارک دیجیتالی و نامرئی SynthID مجهز هستند تا تشخیص آنها از آثار واقعی برای ابزارهای تشخیصی ممکن باشد. در حال حاضر، این سرویس برای تمامی کاربران بالای 18 سال در زبانهایی نظیر انگلیسی، آلمانی، ژاپنی و هندی فعال شده است. اگرچه دسترسی پایه برای عموم رایگان است، اما مشترکین طرحهای پیشرفته مانند AI Premium محدودیت کمتری در تعداد دفعات تولید محتوا خواهند داشت. گوگل وعده داده است که در آیندهای نزدیک، دامنهی زبانهای پشتیبانیشده و کیفیت خروجی را در پلتفرم جمنای به شکل چشمگیری گسترش خواهد داد.
منبع: GSMArena