
تصور کنید که هوش مصنوعی، که اغلب به عنوان انقلاب علمی مدرن توصیف میشود، وقتی در برابر سوالات تاریخی قرار میگیرد، به جای تحلیل دقیق، به حدس و گمان متوسل میشود. پژوهشی که اخیراً در کنفرانس NeurIPS ارائه شد، نشان داد مدلهای زبانی بزرگ از جمله GPT-4، لاما و جمینی، در پاسخ به پرسشهای تاریخی حتی به 50 درصد دقت هم نمیرسند.
هوش مصنوعی سالهاست که به عنوان ابزاری قدرتمند در حوزههایی مانند برنامهنویسی، تولید محتوا و حتی پاسخگویی به پرسشهای پیچیده شناخته شده است. اما پژوهشی جدید نشان داده است که این فناوری همچنان در حوزههایی مانند تاریخنگاری ضعفهای قابل توجهی دارد. در این پژوهش، تیمی از محققان معیار جدیدی با عنوان Hist-LLM ایجاد کردند تا توانایی سه مدل زبانی برتر جهان، یعنی GPT-4 توربو (متعلق به OpenAI)، لاما (متای فیسبوک)، و جمینی (متعلق به گوگل)، در پاسخ به پرسشهای تاریخی را ارزیابی کنند.
این پژوهش که توسط محققانی از مرکز علوم پیچیدگی (CSH) در اتریش انجام شد، نتایج نگرانکنندهای به همراه داشت. به گفته این تیم، بهترین عملکرد متعلق به GPT-4 توربو بود که تنها توانست به 46 درصد دقت دست یابد، عددی که چندان از حدس زدن تصادفی بالاتر نیست. این یافتهها بار دیگر نشان داد که درک عمیق و تحلیلی تاریخ، چالشی فراتر از توانایی کنونی مدلهای هوش مصنوعی است.
چالشهای خاص در تاریخ
یکی از نویسندگان این مقاله، ماریا دل ریو-چانونا، استاد دانشگاه کالج لندن، توضیح داد که مشکل اصلی این مدلها در دادههای مبهم و کمتر شناختهشده نهفته است. او بیان کرد که مدلهای زبانی اغلب از دادههایی که بیشتر در معرض توجه قرار دارند، اطلاعات استخراج میکنند. برای مثال، در پاسخ به سوالی درباره وجود زره فلسدار در مصر باستان، GPT-4 به اشتباه پاسخ مثبت داد، در حالی که این فناوری تنها 1500 سال پس از آن دوره در مصر ظاهر شد.
تأثیر دادههای جانبدارانه
پژوهشگران همچنین متوجه شدند که عملکرد مدلها در پاسخ به پرسشهایی درباره مناطق خاص، مانند آفریقای زیر صحرا، حتی ضعیفتر بوده است. این نتایج بهویژه نشاندهنده مشکلات احتمالی در دادههای آموزشی است که ممکن است دارای تعصبات جغرافیایی باشند.
به گفته پیتر تورچین، محقق ارشد این پژوهش و استاد مرکز CSH، این نتایج به وضوح نشان میدهد که مدلهای هوش مصنوعی هنوز جایگزین مناسبی برای متخصصان انسانی نیستند، بهویژه در حوزههایی که نیاز به تحلیل و درک عمیق دارند.
امید به آینده
با وجود این شکست، محققان نسبت به پتانسیل هوش مصنوعی در حوزه تاریخنگاری خوشبین هستند. آنها در حال بهبود معیار Hist-LLM هستند تا دادههای بیشتری از مناطق کمنمایان و سوالات پیچیدهتر را شامل شود. این تلاشها میتواند به توسعه مدلهایی منجر شود که نه تنها برای پاسخ به سوالات تاریخی دقیقتر باشند، بلکه به مورخان در تجزیهوتحلیل دادههای تاریخی کمک کنند.
به نظر میرسد که هوش مصنوعی با همه قدرت خود، هنوز نیازمند تکامل و آموزش بیشتری است تا بتواند چالشهای انسانی مانند تاریخنگاری را به درستی مدیریت کند. آینده، بدون شک، شاهد تحولاتی بزرگ در این حوزه خواهد بود.