نت باز 360
  • هوش مصنوعی
    • اخبار هوش مصنوعی
    • آموزش هوش مصنوعی
    • تحلیل و بررسی تخصصی
    • کاربردها
      • کاربردهای هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها و نمونه‌کارها
      • سرگرمی و خلاقیت
      • هوش مصنوعی برای مبتدی‌ها
  • تکنولوژی
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
  • نت باز پلاس
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت سایبری
    • گزارش ویژه
    • مقالات همکاری
    • مسائل اخلاقی و اجتماعی
سه شنبه 10 تیر 1404
بدون نتیجه
مشاهده تمام نتایج
  • هوش مصنوعی
    • اخبار هوش مصنوعی
    • آموزش هوش مصنوعی
    • تحلیل و بررسی تخصصی
    • کاربردها
      • کاربردهای هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها و نمونه‌کارها
      • سرگرمی و خلاقیت
      • هوش مصنوعی برای مبتدی‌ها
  • تکنولوژی
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
  • نت باز پلاس
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت سایبری
    • گزارش ویژه
    • مقالات همکاری
    • مسائل اخلاقی و اجتماعی
بدون نتیجه
مشاهده تمام نتایج
نت باز 360
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی گزارش ویژه

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

تحریریه نت باز 360 توسط تحریریه نت باز 360
1403-11-29
در گزارش ویژه
مدت زمان مطالعه: 1 دقیقه
2
معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی
اشتراک گذاری در فیسبوکاشتراک گذاری در توییتراشتراک گذاری در تلگرام

یک گروه پژوهشگر از دانشگاه‌ها و استارتاپ‌های معتبر تصمیم گرفتند با استفاده از حدود ۶۰۰ معمای Sunday Puzzle، مرزهای استدلال مدل‌های هوش مصنوعی را بسنجند. آن‌ها نشان دادند که چگونه مدل‌هایی همچون o1 و DeepSeek’s R1، در مواجهه با معماهای غیرمرتبط با دانش تخصصی عمیق، به شیوه‌ای شبیه به واکنش‌های انسانی عمل می‌کنند؛ از جمله ابراز ناامیدی و ارائه پاسخ‌های نادرست در مواقع بحرانی. این یافته‌ها نه تنها دید تازه‌ای نسبت به ارزیابی هوش مصنوعی ارائه می‌دهد، بلکه ضرورت استفاده از بنچمارک‌هایی را برجسته می‌کند که برای عموم قابل فهم و استفاده باشند.

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

مرتبط مقالات

ویژگی جدید ChatGPT؛ رباتی با شخصیت‌های دلخواه و جذاب!

قوانین جدید هوش مصنوعی در 2025 | آینده خطرناک یا درخشان؟

افزایش قیمت پریمیوم+ پس از عرضه گراک ۳

تحقیق حاضر اهمیت استفاده از معماهایی را به ما نشان می‌دهد که بدون نیاز به دانش پیشرفته، بتوانند توانمندی‌های استدلالی هوش مصنوعی را به خوبی به چالش بکشند. معماهای Sunday Puzzle، که به صورت هفتگی توسط Will Shortz در NPR ارائه می‌شوند، به گونه‌ای طراحی شده‌اند که حتی برای ذهن‌های تیزبین انسانی نیز دشوار باشند. این ویژگی‌ها، پژوهشگران را بر آن داشت تا از این معماها به عنوان معیاری برای سنجش رفتارهای استدلالی مدل‌های هوش مصنوعی استفاده کنند. در این پژوهش، مشاهده شد که برخی از مدل‌ها، مانند DeepSeek’s R1، در مواجهه با سوالات سخت گاهی به نوعی «تسلیم» شده و به جای ارائه پاسخی صحیح، اظهار ناامیدی می‌کنند؛ رفتاری که بسیار انسانی به نظر می‌رسد.

این پژوهش نکات جالبی از جمله فرآیند تفکری پیچیده مدل‌های استدلالی را روشن می‌کند؛ فرآیندی که در آن مدل‌ها قبل از ارائه پاسخ، به دقت گزینه‌های خود را بررسی و حتی گاهی پس از اعلام پاسخ، در جستجوی گزینه‌های بهتری می‌گردند. این رفتارها، اگرچه نشان از توانایی‌های عمیق در تحلیل دارند، اما همچنین نقاط ضعفی مانند تأخیر در ارائه پاسخ و ارائه توضیحات غیرمنطقی را نیز به همراه دارند. علاوه بر این، پژوهشگران به محدودیت‌هایی چون محوریت زبانی و فرهنگی معماها اشاره کرده‌اند؛ چرا که استفاده از معماهای انگلیسی-آمریکایی می‌تواند زمینه‌های تطبیق‌پذیری کمتری را برای سنجش عملکرد مدل‌های هوش مصنوعی در بسترهای چندزبانه فراهم آورد.

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

با توجه به نتایج به دست آمده، مدل o1 به عنوان برترین عملکرد با نمره ۵۹ درصد برجسته شده است؛ در حالی که مدل‌های دیگر امتیازهای پایین‌تری کسب کرده‌اند. این نتایج به ما می‌آموزد که آزمون‌های استدلالی باید از ابعاد گسترده‌تری برخوردار باشند تا بتوانند جنبه‌های انسانی و خلاقانه هوش مصنوعی را به شیوه‌ای کامل منعکس کنند. پژوهشگران بر این باورند که ارائه بنچمارکی که نیاز به دانش پیشرفته نداشته باشد، می‌تواند افق‌های نوینی را برای پژوهشگران از رشته‌های مختلف باز کند و زمینه‌ساز توسعه راه‌حل‌های بهینه‌تر در آینده شود. این امر به ویژه در زمانی که هوش مصنوعی در زندگی روزمره نفوذ بیشتری پیدا می‌کند، اهمیت دوچندان پیدا می‌کند؛ زیرا درک عمومی از قابلیت‌ها و محدودیت‌های این فناوری می‌تواند به تصمیم‌گیری‌های آگاهانه‌تر در سطوح مختلف کمک کند.

پست قبلی

پیشرفت‌های اروپایی در مدل‌های زبانی متن‌باز

پست‌ بعدی

درک عمیق‌تر نیازهای حیوانات با هوش مصنوعی

مقالات مرتبط

ممنوعیت رسمی استارلینک در ایران
گزارش ویژه

ممنوعیت رسمی استارلینک در ایران

1404-04-08
محدودیت تازه X برای آموزش مدل‌های هوش مصنوعی
گزارش ویژه

محدودیت تازه X برای آموزش مدل‌های هوش مصنوعی

1404-03-15
هوش مصنوعی با تهدید جدی‌تر کار می‌کند
گزارش ویژه

هوش مصنوعی با تهدید جدی‌تر کار می‌کند

1404-03-04
ربات‌های جدید دیزنی با کمک انویدیا و گوگل دیپ‌مایند جان می‌گیرند
گزارش ویژه

ربات‌های جدید دیزنی با کمک انویدیا و گوگل دیپ‌مایند جان می‌گیرند

1403-12-29
Nvidia GTC 2025 صحنه‌ای برای آینده هوش مصنوعی و پردازش
گزارش ویژه

Nvidia GTC 2025: صحنه‌ای برای آینده هوش مصنوعی و پردازش

1403-12-23
افزایش قیمت پریمیوم+ پس از عرضه گراک ۳
گزارش ویژه

افزایش قیمت پریمیوم+ پس از عرضه گراک ۳

1403-11-30
لطفاَ برای وارد شدن به گفتگو وارد شوید

توصیه شده.

قدرت تازه کیا K8؛ سدان لوکس کره‌ای با چهره‌ای تازه

قدرت تازه کیا K8؛ سدان لوکس کره‌ای با چهره‌ای تازه

1404-04-05
هوش مصنوعی انقلابی با هزینه کمتر از ۴۵۰ دلار!

هوش مصنوعی انقلابی با هزینه کمتر از ۴۵۰ دلار!

1403-10-23

نوشته‌های تازه

  • هوش مصنوعی مایکروسافت، چالشی برای پزشکان
  • ورود اپل به میدان حلقه‌های هوشمند نزدیک است
  • گلکسی واچ 8 کلاسیک؛ افشا پیش از رونمایی رسمی
  • کلودیوس، مدیر هوش مصنوعی که فروشگاه را به آشوب کشید
  • واکنش سریع OpenAI به جذب نیرو توسط Meta

پرطرفدار.

بررسی فیلم نافرمانی Neposlushnaya 2023: عاشقانه روسی!

بررسی فیلم نافرمانی Neposlushnaya 2023: عاشقانه روسی!

1404-03-06
10 فیلم سینمایی هندی عاشقانه جدید

10 فیلم سینمایی هندی عاشقانه جدید

1404-03-10
20 فیلم هندی جدید که حتما باید ببینید

20 فیلم هندی جدید که حتما باید ببینید

1404-03-08
معرفی پرطرفدارترین سریال های تینیجری همجنسگرایی

معرفی پرطرفدارترین سریال های تینیجری همجنسگرایی

1404-01-01
کد اینترنت اضطراری همراه اول + راهنمای فوری

کد اینترنت اضطراری همراه اول + راهنمای فوری

1404-03-14

NetBaz360

سایت “نت باز 360” به‌طور تخصصی به ارائه اخبار، تحلیل‌ها و مقالات دقیق در زمینه هوش مصنوعی می‌پردازد. هدف ما این است که با پوشش آخرین پیشرفت‌ها و نوآوری‌ها در این حوزه، اطلاعات معتبر و به‌روز را در اختیار علاقه‌مندان و متخصصان قرار دهیم. تیم ما شامل کارشناسان و محققان حوزه هوش مصنوعی است که تلاش دارند تا مطالبی جامع و مفید برای شما فراهم کنند و درک عمیقی از کاربردها و تحولات این فناوری در صنایع مختلف ایجاد کنند.

دسته‌ها

  • VR/AR
  • آموزش هوش مصنوعی
  • ابزارها و پلتفرم‌ها
  • اخبار هوش مصنوعی
  • اطلاعات بیشتر
  • امنیت سایبری
  • پروژه‌ها و نمونه‌کارها
  • پزشکی و بهداشت
  • تجارت و بازاریابی
  • تحلیل و بررسی تخصصی
  • تکنولوژی
  • خودرو
  • سرگرمی و خلاقیت با هوش مصنوعی
  • فناوری‌های پوشیدنی
  • فیلم و سریال
  • کاربردهای هوش مصنوعی
  • گزارش ویژه
  • مسائل اخلاقی و اجتماعی
  • مقالات همکاری
  • نقد و بررسی فیلم و سریال
  • هوش مصنوعی برای مبتدی‌ها

لینک مفید

هارموآرا

آموزش بدن سازی

برج خلیفه چند متر است

آموزش آرایش ساده

مراقبت از پوست

مجله پزشکی سلامتیفای

مجله گردشگری میراث سفر

اصل مطلب

نوشته‌های تازه

  • هوش مصنوعی مایکروسافت، چالشی برای پزشکان
  • ورود اپل به میدان حلقه‌های هوشمند نزدیک است
  • گلکسی واچ 8 کلاسیک؛ افشا پیش از رونمایی رسمی
  • کلودیوس، مدیر هوش مصنوعی که فروشگاه را به آشوب کشید
  • واکنش سریع OpenAI به جذب نیرو توسط Meta
  • تاخیر غیرمنتظره در عرضه DeepSeek R2
  • ممنوعیت رسمی استارلینک در ایران
  • ارتباطات، زیرساخت نجات سازمان در بحران‌ها
  • درباره ما

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • هوش مصنوعی
    • اخبار هوش مصنوعی
    • آموزش هوش مصنوعی
    • تحلیل و بررسی تخصصی
    • کاربردها
      • کاربردهای هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها و نمونه‌کارها
      • سرگرمی و خلاقیت
      • هوش مصنوعی برای مبتدی‌ها
  • تکنولوژی
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
  • نت باز پلاس
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت سایبری
    • گزارش ویژه
    • مقالات همکاری
    • مسائل اخلاقی و اجتماعی

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.