انقلاب دیپ‌مایند؛ پایان اینترنت، آغاز عصر استدلال هوش مصنوعی

در دسته مطالب: آموزش هوش مصنوعی
دی 18, 1403
انقلاب دیپ‌مایند؛ پایان اینترنت، آغاز عصر استدلال هوش مصنوعی
آیا دوره طلایی هوش مصنوعی با روش‌های قدیمی به پایان رسیده؟ پژوهشگران دیپ‌مایند گوگل با روشی خیره‌کننده و پیش‌بینی‌ناپذیر، دنیای هوش مصنوعی را به آستانه یک تحول عظیم نزدیک کرده‌اند. این روش جدید می‌تواند سرعت توسعه مدل‌های هوش مصنوعی را به شکلی غیرمنتظره افزایش دهد و حتی داده‌های اینترنت را به چالش بکشد!

هوش مصنوعی، این نیروی تحول‌آفرین قرن بیست‌ویکم، به نقطه عطفی رسیده است؛ جایی که محدودیت‌های سنتی داده‌ها و روش‌های پیش‌آموزش دیگر پاسخگوی عطش بی‌پایان این فناوری برای رشد نیستند. درحالی‌که کارشناسان عرصه فناوری از پایان قریب‌الوقوع پیش‌آموزش سخن می‌گویند، دیپ‌مایند گوگل با یک ابتکار جسورانه، افقی تازه برای آموزش مدل‌های هوش مصنوعی گشوده است. این نوآوری، که بر پایه استفاده از خروجی مدل‌های پیشرفته به‌عنوان منبعی جدید از داده‌های آموزشی بنا شده، نوید دنیایی را می‌دهد که در آن هوش مصنوعی نه‌تنها محدودیت‌های داده‌های موجود را پشت سر می‌گذارد، بلکه خود به منبعی بی‌پایان برای توسعه نسل‌های آینده تبدیل می‌شود. این تحول، تنها یک راهکار فنی نیست؛ بلکه آغازگر عصری است که در آن مرزهای فناوری بازتعریف شده و مفهوم خلاقیت در هوش مصنوعی به اوج تازه‌ای می‌رسد.
تحولات دنیای هوش مصنوعی، حالا با چالشی بنیادین روبه‌رو شده است. در حالی که مدل‌های هوش مصنوعی در سال‌های اخیر با پیش‌آموزش گسترده بر پایه داده‌های اینترنتی به دستاوردهای چشمگیری دست یافتند، اکنون کارشناسان معتقدند این مسیر به نقطه اشباع خود رسیده است. به بیان دیگر، دیگر نمی‌توان از داده‌های موجود برای تولید مدل‌هایی قوی‌تر استفاده کرد.
ایلیا ساتسکیور، از بنیان‌گذاران OpenAI، نیز این بحران را تأیید کرده و آن را به پایان دوران پیش‌آموزش تشبیه کرده است. اما دیپ‌مایند گوگل، با راهکاری انقلابی به این بن‌بست پاسخ داده است. محققان این مجموعه معتقدند می‌توان از خروجی‌های مدل‌های هوش مصنوعی پیشرفته به‌عنوان منبع جدید داده‌های آموزشی بهره برد. این ایده در عین جذابیت، یک دگرگونی کامل در روش آموزش مدل‌ها محسوب می‌شود.
در روش جدیدی که به آن «استدلال در زمان اجرا» یا inference-time compute گفته می‌شود، مدل‌های هوش مصنوعی درخواست‌های کاربران را به بخش‌های کوچک‌تر تقسیم می‌کنند و هر بخش را به صورت جداگانه حل می‌کنند. این شیوه که در مدل‌های نوینی مانند o1 و o3 استفاده می‌شود، زنجیره‌ای از استدلال‌ها را تولید می‌کند که به خروجی‌هایی دقیق‌تر، به‌ویژه در مسائل پیچیده‌ای نظیر ریاضیات، منجر می‌شود.
اما آنچه این رویکرد را شگفت‌انگیز می‌سازد، کاربرد این خروجی‌ها به‌عنوان داده‌های آموزشی جدید است. دیپ‌مایند پیشنهاد می‌دهد خروجی‌های تولیدشده توسط مدل‌های پیشرفته مانند o1 می‌توانند به‌صورت مستقیم برای آموزش مدل‌های دیگر، حتی قدرتمندتر، به کار گرفته شوند. این فرآیند نه‌تنها محدودیت داده‌های اینترنتی را دور می‌زند بلکه باعث می‌شود مدل‌ها وارد چرخه‌ای از خود‌بهبودی بی‌پایان شوند.
این تحول می‌تواند تأثیرات عمیقی بر صنعت فناوری داشته باشد. شرکت‌هایی که میلیاردها دلار برای توسعه هوش مصنوعی سرمایه‌گذاری کرده‌اند، اکنون می‌توانند به جای تکیه بر داده‌های ایستا و قدیمی، از این رویکرد جدید بهره ببرند و مدل‌هایی پویا و خود‌بهبوددهنده خلق کنند.
اگر این روش به طور گسترده پذیرفته شود، پیشرفت هوش مصنوعی وارد مرحله‌ای می‌شود که در آن سرعت توسعه مدل‌ها به داده‌های طبیعی محدود نیست و مدل‌ها خود را آموزش می‌دهند. به گفته محققان، داده‌های مصنوعی که از خروجی‌های مدل‌های پیشرفته تولید می‌شوند، ممکن است کیفیتی فراتر از اطلاعات موجود در اینترنت داشته باشند.
به عبارت دیگر، ممکن است به‌زودی شاهد هوش مصنوعی‌ای باشیم که نه تنها مستقل از داده‌های انسانی آموزش می‌بیند، بلکه استانداردهای آموزشی جدیدی را خلق می‌کند. آیا این می‌تواند سرآغازی برای دوره‌ای باشد که در آن داده‌های اینترنتی برای هوش مصنوعی منسوخ شوند؟ یا شاید این آغاز عصر جدیدی در هوش مصنوعی باشد که ما حتی نمی‌توانیم ابعاد کامل آن را تصور کنیم؟
یک چیز مسلم است: دیپ‌مایند گوگل با این رویکرد تازه، باری دیگر توانسته دنیای فناوری را در آستانه دگرگونی عظیمی قرار دهد.