شرکت دیپ‌سیک ۱.۶ میلیارد دلار برای هوش مصنوعی هزینه کرده است

زمان مورد نیاز برای مطالعه: ۳ دقیقه
دیپ‌سیک

در صحنه رقابتی و پرتحول هوش مصنوعی، همواره شاهد ظهور و سقوط بازیگران جدید بوده‌ایم. شرکت چینی دیپ‌سیک، به عنوان یکی از این بازیگران نوظهور، با ادعاهایی بلندپروازانه مبنی بر کاهش چشمگیر هزینه‌های آموزش مدل‌های پیشرفته هوش مصنوعی، در کانون توجه قرار گرفته است. این شرکت ادعا می‌کند که مدل R1 خود را با بودجه‌ای ۶ میلیون دلاری و با بهره‌گیری از ۲۰۴۸ پردازنده گرافیکی آموزش داده است. این در حالی است که رقبای آمریکایی برای دستیابی به مدل‌های مشابه، هزینه‌هایی چندین برابر و بالغ بر میلیاردها دلار را متحمل می‌شوند. اما آیا این ادعاها تا چه حد قابل اتکا هستند؟

بر اساس گزارش منتشر شده توسط موسسه تحقیقاتی SemiAnalysis، دیپ‌سیک برای ایجاد زیرساخت‌های مورد نیاز خود، حدود ۱.۶ میلیارد دلار سرمایه‌گذاری کرده و از مجموعه‌ای قدرتمند شامل ۵۰ هزار پردازنده گرافیکی Hopper، از جمله ۱۰ هزار H800 و ۱۰ هزار H100، بهره می‌برد. این داده‌های ارائه شده توسط SemiAnalysis، با ادعاهای اولیه دیپ‌سیک مبنی بر هزینه‌های ناچیز آموزش مدل‌ها، در تضاد است. به نظر می‌رسد که رقم ۶ میلیون دلار، تنها بخشی از هزینه‌های آموزش، به طور مشخص هزینه مربوط به زمان پردازش گرافیکی در مرحله پیش‌آموزش مدل را منعکس می‌کند و هزینه‌های سنگین‌تر تحقیق و توسعه، پردازش حجم انبوه داده‌ها و زیرساخت‌های گسترده را نادیده گرفته است.

دیپ‌سیک

شایان ذکر است که دیپ‌سیک در واقع از دل شرکت سرمایه‌گذاری چینی High-Flyer سر برآورده است. این شرکت از سال‌ها پیش، سرمایه‌گذاری‌های قابل توجهی را در حوزه‌های هوش مصنوعی و پردازنده‌های گرافیکی به انجام رسانده بود. در سال ۲۰۲۳، High-Flyer تصمیم گرفت دیپ‌سیک را به عنوان یک نهاد مستقل و متخصص در زمینه هوش مصنوعی بنیان کند. یکی از ویژگی‌های متمایز دیپ‌سیک، اتخاذ رویکردی خوداتکا در قیاس با بسیاری از استارت‌آپ‌های مشابه است. دیپ‌سیک به جای وابستگی به سرویس‌های ابری، مراکز داده اختصاصی خود را راهبری می‌کند. این استقلال عمل به دیپ‌سیک امکان می‌دهد تا فرایند آزمایش و بهینه‌سازی مدل‌های هوش مصنوعی خود را به طور کامل مدیریت کند و بدون نیاز به تعامل با شرکت‌های بیرونی، تغییرات ضروری را به سرعت اعمال نماید.

یکی دیگر از نقاط قوت کلیدی دیپ‌سیک، توانایی جذب نخبگان و استعدادهای برتر از داخل مرزهای چین است. این شرکت با ارائه بسته‌های جبرانی رقابتی و وسوسه‌انگیز، متخصصان برجسته هوش مصنوعی را از دانشگاه‌های معتبر چینی، نظیر دانشگاه پکن و دانشگاه ژجیانگ، به خدمت می‌گیرد. گزارش‌ها نشان می‌دهند که برخی از پژوهشگران هوش مصنوعی در دیپ‌سیک، سالانه بالغ بر ۱.۳ میلیون دلار دستمزد دریافت می‌کنند که حتی از سطوح پرداختی شرکت‌های بزرگ هوش مصنوعی چینی مانند مون‌شات نیز فراتر می‌رود.

دیپ‌سیک

دیپ‌سیک به جای تمرکز صرف بر افزایش مقیاس سخت‌افزاری، استراتژی متفاوتی را پیاده‌سازی کرده و بر ارتقای الگوریتم‌ها و نوآوری‌های فنی تاکید دارد. برای مثال، این شرکت الگوریتم Multi-Head Latent Attention (MLA) را توسعه داده است که حاصل ماه‌ها تلاش پژوهشی و بهره‌گیری گسترده از پردازنده‌های گرافیکی بوده است. مدیرعامل دیپ‌سیک خاطرنشان می‌کند که با اتخاذ رویکردهای هوشمندانه و الگوریتم‌های کارآمد، می‌توان با صرف منابع محدودتر، به نتایجی هم‌تراز یا حتی برتر دست یافت.

با این حال، دستاوردهای دیپ‌سیک تنها معلول نوآوری‌های فنی نیست، بلکه سرمایه‌گذاری‌های عظیم و جذب استعدادهای نخبه نیز در این میان نقش تعیین‌کننده‌ای ایفا می‌کنند. از منظر بسیاری از متخصصان حوزه سخت‌افزار، ادعاهای اولیه این شرکت پیرامون هزینه‌های بسیار اندک آموزش مدل‌های هوش مصنوعی، بیشتر جنبه تبلیغاتی داشته و از واقعیت فاصله دارد. در حقیقت، دیپ‌سیک نیز همچون سایر شرکت‌های پیشرو در عرصه هوش مصنوعی، برای حفظ جایگاه رقابتی خود، نیازمند سرمایه‌گذاری‌های هنگفت و کوشش‌های پیگیر و مداوم است.

منبع: Tom’s Hardware



برچسب‌ها :
دیدگاه شما

پرسش امنیتی *-- بارگیری کد امنیتی --

loading...
بازدیدهای اخیر
بر اساس بازدیدهای اخیر شما
تاریخچه بازدیدها
مشاهده همه
دسته‌بندی‌های منتخب برای شما
X