54 بازدید 5 ثانیه 0 دیدگاه

آیا هوش مصنوعی در تاریخ شکست خورده است؟

در دسته مطالب: گزارش ویژه
بهمن 01, 1403
آیا هوش مصنوعی در تاریخ شکست خورده است؟
هوش مصنوعی که در دنیای برنامه‌نویسی و تولید محتوای صوتی درخشان ظاهر شده است، حالا در مقابل آزمونی از تاریخ به زانو درآمده! پژوهشی جدید نشان می‌دهد که برترین مدل‌های زبانی جهان هنوز برای فهم عمیق تاریخ ناتوان هستند. این نتایج نه تنها بحث‌برانگیز، بلکه هشداردهنده است.

تصور کنید که هوش مصنوعی، که اغلب به عنوان انقلاب علمی مدرن توصیف می‌شود، وقتی در برابر سوالات تاریخی قرار می‌گیرد، به جای تحلیل دقیق، به حدس و گمان متوسل می‌شود. پژوهشی که اخیراً در کنفرانس NeurIPS ارائه شد، نشان داد مدل‌های زبانی بزرگ از جمله GPT-4، لاما و جمینی، در پاسخ به پرسش‌های تاریخی حتی به 50 درصد دقت هم نمی‌رسند.

هوش مصنوعی سال‌هاست که به عنوان ابزاری قدرتمند در حوزه‌هایی مانند برنامه‌نویسی، تولید محتوا و حتی پاسخگویی به پرسش‌های پیچیده شناخته شده است. اما پژوهشی جدید نشان داده است که این فناوری همچنان در حوزه‌هایی مانند تاریخ‌نگاری ضعف‌های قابل توجهی دارد. در این پژوهش، تیمی از محققان معیار جدیدی با عنوان Hist-LLM ایجاد کردند تا توانایی سه مدل زبانی برتر جهان، یعنی GPT-4 توربو (متعلق به OpenAI)، لاما (متای فیسبوک)، و جمینی (متعلق به گوگل)، در پاسخ به پرسش‌های تاریخی را ارزیابی کنند.

این پژوهش که توسط محققانی از مرکز علوم پیچیدگی (CSH) در اتریش انجام شد، نتایج نگران‌کننده‌ای به همراه داشت. به گفته این تیم، بهترین عملکرد متعلق به GPT-4 توربو بود که تنها توانست به 46 درصد دقت دست یابد، عددی که چندان از حدس زدن تصادفی بالاتر نیست. این یافته‌ها بار دیگر نشان داد که درک عمیق و تحلیلی تاریخ، چالشی فراتر از توانایی کنونی مدل‌های هوش مصنوعی است.

چالش‌های خاص در تاریخ

یکی از نویسندگان این مقاله، ماریا دل ریو-چانونا، استاد دانشگاه کالج لندن، توضیح داد که مشکل اصلی این مدل‌ها در داده‌های مبهم و کمتر شناخته‌شده نهفته است. او بیان کرد که مدل‌های زبانی اغلب از داده‌هایی که بیشتر در معرض توجه قرار دارند، اطلاعات استخراج می‌کنند. برای مثال، در پاسخ به سوالی درباره وجود زره فلس‌دار در مصر باستان، GPT-4 به اشتباه پاسخ مثبت داد، در حالی که این فناوری تنها 1500 سال پس از آن دوره در مصر ظاهر شد.

تأثیر داده‌های جانبدارانه

پژوهشگران همچنین متوجه شدند که عملکرد مدل‌ها در پاسخ به پرسش‌هایی درباره مناطق خاص، مانند آفریقای زیر صحرا، حتی ضعیف‌تر بوده است. این نتایج به‌ویژه نشان‌دهنده مشکلات احتمالی در داده‌های آموزشی است که ممکن است دارای تعصبات جغرافیایی باشند.

به گفته پیتر تورچین، محقق ارشد این پژوهش و استاد مرکز CSH، این نتایج به وضوح نشان می‌دهد که مدل‌های هوش مصنوعی هنوز جایگزین مناسبی برای متخصصان انسانی نیستند، به‌ویژه در حوزه‌هایی که نیاز به تحلیل و درک عمیق دارند.

امید به آینده

با وجود این شکست، محققان نسبت به پتانسیل هوش مصنوعی در حوزه تاریخ‌نگاری خوش‌بین هستند. آن‌ها در حال بهبود معیار Hist-LLM هستند تا داده‌های بیشتری از مناطق کم‌نمایان و سوالات پیچیده‌تر را شامل شود. این تلاش‌ها می‌تواند به توسعه مدل‌هایی منجر شود که نه تنها برای پاسخ به سوالات تاریخی دقیق‌تر باشند، بلکه به مورخان در تجزیه‌وتحلیل داده‌های تاریخی کمک کنند.

به نظر می‌رسد که هوش مصنوعی با همه قدرت خود، هنوز نیازمند تکامل و آموزش بیشتری است تا بتواند چالش‌های انسانی مانند تاریخ‌نگاری را به درستی مدیریت کند. آینده، بدون شک، شاهد تحولاتی بزرگ در این حوزه خواهد بود.