
استارتاپ چینی دیپسیک، بدون هیاهوی تبلیغاتی، مدل جدید هوش مصنوعی خود را منتشر کرده است؛ مدلی که نهتنها در کدنویسی بهبود یافته، بلکه میتواند رقابت نزدیکی با محصولات غولهای فناوری آمریکایی داشته باشد.
ورود بیسروصدای یک رقیب جدی
در حالی که شرکتهای آمریکایی معمولاً مدلهای جدید خود را با تبلیغات گسترده معرفی میکنند، استارتاپ چینی دیپسیک، بیسروصدا نسخه جدید مدل هوش مصنوعی خود، V3-0324 را ارائه کرده است. این مدل که اکنون بهصورت متنباز در Hugging Face در دسترس است، از معماری پیشرفتهای بهره میبرد و در برخی بخشها بهبودهای چشمگیری داشته است. اما آیا این مدل میتواند به رقیبی جدی برای OpenAI و Anthropic تبدیل شود؟
انتشار DeepSeek-V3-0324 و ویژگیهای آن
طبق گزارش TechRadar، مدل DeepSeek-V3-0324 با حجم 641 گیگابایت منتشر شده و با مجوز MIT بهصورت متنباز در اختیار توسعهدهندگان قرار گرفته است. این مدل برخلاف نمونههای آمریکایی، تقریباً بدون تبلیغات و اطلاعیه رسمی عرضه شده است.
بررسیهای اولیه نشان میدهد که این مدل روی مک استودیو با تراشه M3 Ultra عملکردی قابلتوجه داشته و توانسته است با سرعتی بیش از 20 توکن در ثانیه پردازش کند. البته، قدرت سختافزار استفادهشده در این تست نباید نادیده گرفته شود.
ارتقاهای کلیدی و پیشرفت مداوم دیپسیک
دیپسیک که سال گذشته نام خود را مطرح کرد، پس از انتشار نسخه اصلی V3 در دسامبر 2024، سرعت توسعه بالایی داشته است. تنها یک ماه پس از آن، مدل R1 با قابلیت استدلالگری معرفی شد و حالا نسخه بهبودیافته V3-0324 در دسترس قرار گرفته است.
حتی اگر این مدل در برخی بنچمارکها از OpenAI و Anthropic عقبتر باشد، اما از لحاظ هزینه مزیت رقابتی قابلتوجهی دارد. این امر میتواند آن را به گزینهای جذاب برای توسعهدهندگانی تبدیل کند که بهدنبال مدلهای مقرونبهصرفه اما قدرتمند هستند.
معماری MoE و چشمانداز رقابتی
یکی از مهمترین ویژگیهای DeepSeek-V3-0324، استفاده از معماری ترکیب متخصصان (MoE) است. برخلاف مدلهای زبانی معمولی که تمام پارامترهای خود را برای پردازش فعال میکنند، این مدل تنها 37 میلیارد از 685 میلیارد پارامتر را هنگام اجرای وظایف خاص به کار میگیرد. این رویکرد میتواند باعث افزایش بهرهوری و کاهش مصرف منابع محاسباتی شود.
با توجه به سرعت توسعه دیپسیک، این شرکت احتمالاً در آینده مدلهای قویتری ارائه خواهد داد. اگرچه هنوز مشخص نیست که آیا این مدل میتواند در سطح بالاترین محصولات OpenAI و Anthropic قرار گیرد، اما استراتژی متنباز و هزینه کمتر میتواند آن را به بازیگری جدی در بازار هوش مصنوعی تبدیل کند.