در حالیکه بازار هوش مصنوعی با سرعت سرسامآوری بهپیش میرود، شرکت چینی دیپسیک تصمیمی غیرمنتظره گرفت: عرضه مدل پیشرفته DeepSeek R2 به تعویق افتاد. این تصمیم درحالی اعلام شد که بسیاری از فعالان صنعت منتظر رونمایی یکی از قدرتمندترین مدلهای زبان مصنوعی این شرکت بودند.
علت اصلی این تاخیر، نارضایتی مدیرعامل دیپسیک، «لیانگ ونفنگ»، از عملکرد فنی مدل اعلام شده است. این مدل که نسخه ارتقاءیافته مدل موفق DeepSeek R1 محسوب میشود، هنوز نتوانسته استانداردهای مورد نظر مدیران شرکت را برآورده سازد. اما پشتپردهی این تصمیم، دلایل مهمتری نهفته است.
توقف در لحظه آخر عرضه DeepSeek R2؛ مدل هنوز آماده نیست
مدل DeepSeek R2 قرار بود در ماه مه وارد بازار شود. با هدف ارتقاء تواناییهای مدل R1، نسخهی جدید با تمرکز بر کدنویسی پیشرفتهتر و پشتیبانی از زبانهای متنوع طراحی شده بود. اما عدم رضایت مدیرعامل از عملکرد آزمایشی مدل باعث شد عرضه بهطور کامل متوقف شود.
طبق گزارش رویترز، این تصمیم در بالاترین سطح مدیریتی گرفته شده و تا زمان دستیابی به کیفیت مطلوب، خبری از عرضه نخواهد بود.
محدودیت چیپها؛ مانع فنی جدی در مسیر توسعه DeepSeek R2
یکی از مهمترین چالشهایی که تیم دیپسیک با آن مواجه است، کمبود چیپهای سرور انویدیا در چین است. این بحران، نتیجه مستقیم محدودیتهای صادراتی آمریکا است که اخیراً تشدید شده و مانع دسترسی شرکتهای چینی به چیپهای کلیدی مانند H20 شده است.
بدون این پردازندهها، پیادهسازی و آموزش مدلهای بزرگ مانند R2 با سرعت و دقت کافی غیرممکن خواهد بود.
فشار مضاعف بر شرکتهای ابری چینی
افزایش تقاضا برای مدل R2، زنگ خطر را برای ارائهدهندگان خدمات ابری در چین به صدا درآورده است. این شرکتها که هماکنون مدل DeepSeek R1 را اجرا میکنند، از چیپهای H20 انویدیا استفاده میکنند. اما با اعمال تحریمهای جدید، آینده این زیرساختها در هالهای از ابهام قرار گرفته است.
در چنین شرایطی، توزیع و میزبانی نسخه جدید میتواند منابع سختافزاری این شرکتها را فراتر از ظرفیتشان درگیر کند.
همکاریهای پشت پرده با ارائهدهندگان ابری
با وجود چالشها، دیپسیک به صورت غیررسمی با شرکتهای بزرگ ابری چین در حال همکاری است. اطلاعات فنی مدل R2 به این شرکتها منتقل شده تا زیرساختهای لازم برای میزبانی و توزیع بهینه مدل از هماکنون آمادهسازی شوند.
این اقدامات نشان میدهد که اگرچه عرضه رسمی متوقف شده، فرایندهای پشتیبانی و استقرار در حال اجراست و دیپسیک قصد دارد به محض رفع نواقص، مدل را با قدرت معرفی کند.
تقاضای فزاینده و زیرساختهای ناپایدار
با وجود تأخیر، تقاضا برای DeepSeek R2 بالاست. این موضوع میتواند زیرساختهای ضعیف ابری چین را با چالش مواجه کند. افزایش یکباره در اجرای مدل روی سرورهای محدود، میتواند منجر به کندی یا اختلال در عملکرد شود؛ اتفاقی که دیپسیک میخواهد از آن اجتناب کند.
واکنش مبهم دیپسیک به رسانهها
شرکت دیپسیک تاکنون پاسخی رسمی به پرسشهای رسانهها نداده است. اما شواهد موجود از تلاش برای ارتقای عملکرد مدل و هماهنگی با محدودیتهای بازار سختافزار حکایت دارد. دیپسیک میداند عرضه نسخهای ناقص از مدل R2 میتواند تمام اعتبار R1 را نیز زیر سؤال ببرد.
ویژگیهای کلیدی مدل DeepSeek R2 (پیشبینیشده)
ویژگی | توضیحات |
---|---|
جانشین DeepSeek R1 | نسخهی پیشرفتهتر با قابلیتهای استدلالی بهبودیافته |
پشتیبانی چندزبانه | هدفگذاری بر زبانهایی فراتر از انگلیسی |
بهینهسازی تولید کد | تمرکز بر تولید کد دقیقتر و سریعتر |
هماهنگ با چیپهای H20 انویدیا | با توجه به محدودیت بازار، طراحی شده برای اجرا روی چیپهای موجود |
در حال توسعه با همکاری شرکتهای ابری | پشتیبانی زیرساختی برای توزیع گستردهتر در دست بررسی است |
توقف عرضه DeepSeek R2 را نمیتوان تنها یک تصمیم فنی دانست؛ این اتفاق بازتابی از تقاطع فناوری، ژئوپلیتیک و زیرساختهای داخلی است. از یکسو، استانداردهای بالای مدیرعامل شرکت نشاندهنده تعهد به کیفیت است، اما از سوی دیگر، محدودیتهای شدید در دسترسی به منابع سختافزاری و رقابت سنگین جهانی در حوزه AI، دیپسیک را تحتفشار قرار دادهاند.
پیشبینی میشود که در صورت رفع چالشهای موجود خصوصاً در حوزه تأمین چیپ، مدل R2 در نیمه دوم سال ۲۰۲۵ عرضه شود. البته موفقیت آن تا حد زیادی به بهینهسازی عملکرد مدل و تضمین پایداری اجرای آن در زیرساختهای ابری بستگی خواهد داشت.
جمعبندی
مدل DeepSeek R2 که قرار بود نقطهی عطفی در مسیر توسعه هوش مصنوعی چینی باشد، فعلاً با مانعی جدی مواجه شده است. نارضایتی مدیرعامل از عملکرد، کمبود تراشههای قدرتمند انویدیا و فشار تقاضا روی زیرساختها، همگی عرضه این مدل را به تعویق انداختهاند. با اینکه دیپسیک سکوت اختیار کرده، اما تلاشهای پشتپرده برای بهبود عملکرد و فراهمسازی زیرساختها ادامه دارد. آینده مدل R2 هنوز نامشخص است، اما بدون شک تأثیر آن در معادلات هوش مصنوعی آسیا پررنگ خواهد بود.