
در دنیایی که هوش مصنوعی هر روز مرزهای جدیدی را درنوردیده و تواناییهای خارقالعادهای از خود نشان میدهد، خبرهایی از توسعه مدلهای هوش مصنوعی با قابلیت استدلال پیچیده به گوش میرسد که نه تنها از لحاظ عملکرد، بلکه از نظر هزینههای توسعه نیز شگفتانگیز هستند. تیم تحقیقاتی NovaSky، از دانشگاه برکلی، با انتشار مدلی به نام Sky-T1-32B-Preview ثابت کرده که ساخت مدلهای استدلالی پیچیده، دیگر نیازی به بودجههای میلیون دلاری ندارد.
این مدل، که تنها با صرف کمتر از ۴۵۰ دلار آموزش داده شده، توانسته در معیارهای مهمی با مدلهای مشهور جهانی رقابت کند. این دستاورد نشاندهنده تغییری بنیادین در نحوه توسعه هوش مصنوعی و دسترسی گستردهتر به فناوریهای پیشرفته است.
مدل Sky-T1-32B-Preview را میتوان یکی از انقلابیترین دستاوردها در عرصه هوش مصنوعی دانست. در حالی که هزینههای توسعه مدلهای مشابه در سالهای اخیر به میلیونها دلار میرسید، تیم NovaSky موفق شده است تنها با بودجهای کمتر از ۴۵۰ دلار، مدلی با قابلیتهای استدلالی چشمگیر تولید کند.
یکی از دلایل اصلی این کاهش هزینه، استفاده از دادههای آموزشی مصنوعی است. دادههای مصنوعی که توسط مدلهای پیشرفتهتر تولید میشوند، به تیمها این امکان را میدهند تا بدون نیاز به مجموعههای دادهی عظیم و پرهزینه، مدلهای خود را آموزش دهند. این روش نه تنها هزینهها را کاهش میدهد بلکه باعث تسریع فرایند توسعه نیز میشود.
مدل Sky-T1، که بر اساس دادههایی تولید شده توسط مدل Alibaba’s QwQ-32B-Preview توسعه یافته، توانسته در معیارهایی نظیر MATH500 و LiveCodeBench عملکردی بهتر از مدلهای مشابه ارائه دهد. این مدل، با استفاده از ترکیبی از تکنیکهای پیشرفته، دادههای آموزشی را به شکلی مؤثرتر و کارآمدتر پردازش کرده است.
اما این همه ماجرا نیست. هرچند که Sky-T1 در حوزههایی نظیر ریاضیات و کدنویسی عملکردی خارقالعاده داشته، اما همچنان در برخی معیارها، مانند GPQA-Diamond که شامل سؤالات پیچیده از حوزههای فیزیک، زیستشناسی و شیمی است، نتوانسته با مدل o1 رقابت کند.
نکته مهم دیگر این است که مدل o1 از OpenAI در نسخه نهایی خود، بسیار قویتر از نسخه پیشنمایش آن است که Sky-T1 با آن مقایسه شده است. همچنین OpenAI در آستانه عرضه نسخه پیشرفتهتری به نام o3 قرار دارد که احتمالاً شکاف عملکردی را بیشتر میکند.
با این حال، هدف NovaSky صرفاً رقابت نیست. این تیم به وضوح اعلام کرده که Sky-T1 تنها آغاز راه است و آنها در تلاشاند تا مدلهایی با کارایی بالاتر و هزینه کمتر تولید کنند. آنها معتقدند که آینده در دستان مدلهای متنباز و ارزانقیمتی است که قدرت استدلال بالایی دارند و برای طیف وسیعتری از کاربران قابل دسترسی هستند.
مدل Sky-T1 نمادی از دموکراتیک شدن هوش مصنوعی است. این دستاورد نشان میدهد که فناوریهای پیشرفته، دیگر در انحصار شرکتهای چندملیتی باقی نمیمانند و تیمهای کوچکتر نیز میتوانند با خلاقیت و نوآوری، دنیا را متحول کنند. اگرچه هنوز چالشهای زیادی در راه توسعه مدلهای متنباز وجود دارد، اما چشمانداز روشن است: هوش مصنوعی برای همه.