شرکت دیپسیک ۱.۶ میلیارد دلار برای هوش مصنوعی هزینه کرده است

در صحنه رقابتی و پرتحول هوش مصنوعی، همواره شاهد ظهور و سقوط بازیگران جدید بودهایم. شرکت چینی دیپسیک، به عنوان یکی از این بازیگران نوظهور، با ادعاهایی بلندپروازانه مبنی بر کاهش چشمگیر هزینههای آموزش مدلهای پیشرفته هوش مصنوعی، در کانون توجه قرار گرفته است. این شرکت ادعا میکند که مدل R1 خود را با بودجهای ۶ میلیون دلاری و با بهرهگیری از ۲۰۴۸ پردازنده گرافیکی آموزش داده است. این در حالی است که رقبای آمریکایی برای دستیابی به مدلهای مشابه، هزینههایی چندین برابر و بالغ بر میلیاردها دلار را متحمل میشوند. اما آیا این ادعاها تا چه حد قابل اتکا هستند؟
بر اساس گزارش منتشر شده توسط موسسه تحقیقاتی SemiAnalysis، دیپسیک برای ایجاد زیرساختهای مورد نیاز خود، حدود ۱.۶ میلیارد دلار سرمایهگذاری کرده و از مجموعهای قدرتمند شامل ۵۰ هزار پردازنده گرافیکی Hopper، از جمله ۱۰ هزار H800 و ۱۰ هزار H100، بهره میبرد. این دادههای ارائه شده توسط SemiAnalysis، با ادعاهای اولیه دیپسیک مبنی بر هزینههای ناچیز آموزش مدلها، در تضاد است. به نظر میرسد که رقم ۶ میلیون دلار، تنها بخشی از هزینههای آموزش، به طور مشخص هزینه مربوط به زمان پردازش گرافیکی در مرحله پیشآموزش مدل را منعکس میکند و هزینههای سنگینتر تحقیق و توسعه، پردازش حجم انبوه دادهها و زیرساختهای گسترده را نادیده گرفته است.
شایان ذکر است که دیپسیک در واقع از دل شرکت سرمایهگذاری چینی High-Flyer سر برآورده است. این شرکت از سالها پیش، سرمایهگذاریهای قابل توجهی را در حوزههای هوش مصنوعی و پردازندههای گرافیکی به انجام رسانده بود. در سال ۲۰۲۳، High-Flyer تصمیم گرفت دیپسیک را به عنوان یک نهاد مستقل و متخصص در زمینه هوش مصنوعی بنیان کند. یکی از ویژگیهای متمایز دیپسیک، اتخاذ رویکردی خوداتکا در قیاس با بسیاری از استارتآپهای مشابه است. دیپسیک به جای وابستگی به سرویسهای ابری، مراکز داده اختصاصی خود را راهبری میکند. این استقلال عمل به دیپسیک امکان میدهد تا فرایند آزمایش و بهینهسازی مدلهای هوش مصنوعی خود را به طور کامل مدیریت کند و بدون نیاز به تعامل با شرکتهای بیرونی، تغییرات ضروری را به سرعت اعمال نماید.
یکی دیگر از نقاط قوت کلیدی دیپسیک، توانایی جذب نخبگان و استعدادهای برتر از داخل مرزهای چین است. این شرکت با ارائه بستههای جبرانی رقابتی و وسوسهانگیز، متخصصان برجسته هوش مصنوعی را از دانشگاههای معتبر چینی، نظیر دانشگاه پکن و دانشگاه ژجیانگ، به خدمت میگیرد. گزارشها نشان میدهند که برخی از پژوهشگران هوش مصنوعی در دیپسیک، سالانه بالغ بر ۱.۳ میلیون دلار دستمزد دریافت میکنند که حتی از سطوح پرداختی شرکتهای بزرگ هوش مصنوعی چینی مانند مونشات نیز فراتر میرود.
دیپسیک به جای تمرکز صرف بر افزایش مقیاس سختافزاری، استراتژی متفاوتی را پیادهسازی کرده و بر ارتقای الگوریتمها و نوآوریهای فنی تاکید دارد. برای مثال، این شرکت الگوریتم Multi-Head Latent Attention (MLA) را توسعه داده است که حاصل ماهها تلاش پژوهشی و بهرهگیری گسترده از پردازندههای گرافیکی بوده است. مدیرعامل دیپسیک خاطرنشان میکند که با اتخاذ رویکردهای هوشمندانه و الگوریتمهای کارآمد، میتوان با صرف منابع محدودتر، به نتایجی همتراز یا حتی برتر دست یافت.
با این حال، دستاوردهای دیپسیک تنها معلول نوآوریهای فنی نیست، بلکه سرمایهگذاریهای عظیم و جذب استعدادهای نخبه نیز در این میان نقش تعیینکنندهای ایفا میکنند. از منظر بسیاری از متخصصان حوزه سختافزار، ادعاهای اولیه این شرکت پیرامون هزینههای بسیار اندک آموزش مدلهای هوش مصنوعی، بیشتر جنبه تبلیغاتی داشته و از واقعیت فاصله دارد. در حقیقت، دیپسیک نیز همچون سایر شرکتهای پیشرو در عرصه هوش مصنوعی، برای حفظ جایگاه رقابتی خود، نیازمند سرمایهگذاریهای هنگفت و کوششهای پیگیر و مداوم است.
منبع: Tom’s Hardware