نت‌باز 360
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
    • پیشنهاد فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مینی‌چرا
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • دایرکتوری ابزارهای هوش مصنوعی
  • اپلیکیشندانلود
تبلیغات
شنبه 27 دی 1404
بدون نتیجه
مشاهده تمام نتایج
نت‌باز 360
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
    • پیشنهاد فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مینی‌چرا
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • دایرکتوری ابزارهای هوش مصنوعی
  • اپلیکیشندانلود
بدون نتیجه
مشاهده تمام نتایج
نت‌باز 360
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی گزارش ویژه
معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

توسط تحریریه نت باز 360
1403-11-29
در گزارش ویژه
مدت زمان مطالعه: 1 دقیقه

یک گروه پژوهشگر از دانشگاه‌ها و استارتاپ‌های معتبر تصمیم گرفتند با استفاده از حدود ۶۰۰ معمای Sunday Puzzle، مرزهای استدلال مدل‌های هوش مصنوعی را بسنجند. آن‌ها نشان دادند که چگونه مدل‌هایی همچون o1 و DeepSeek’s R1، در مواجهه با معماهای غیرمرتبط با دانش تخصصی عمیق، به شیوه‌ای شبیه به واکنش‌های انسانی عمل می‌کنند؛ از جمله ابراز ناامیدی و ارائه پاسخ‌های نادرست در مواقع بحرانی. این یافته‌ها نه تنها دید تازه‌ای نسبت به ارزیابی هوش مصنوعی ارائه می‌دهد، بلکه ضرورت استفاده از بنچمارک‌هایی را برجسته می‌کند که برای عموم قابل فهم و استفاده باشند.

آیا با راه‌اندازی کانال تلگرام برای انتشار فیلم‌های معرفی‌شده توسط نت باز 360 موافق هستید؟

با هدف دسترسی آسان‌تر شما به فیلم‌های معرفی‌شده در دسته‌بندی‌های \\\"فیلم و سریال\\\" و \\\"پیشنهاد فیلم و سریال\\\"📽، درحال بررسی راه‌اندازی یک کانال تلگرام هستیم. نظر شما به ما کمک می‌کند تا در مسیر بهبود تجربه کاربری، تصمیم دقیق‌تری بگیریم. اگر بعداز ثبت نظر با خطای «نظر شما ثبت نشد» مواجه شدید نگران نباشید✅ نظر شما ثبت شده است. این اختلال به‌دلیل نرخ تازه‌سازی صفحه رخ داده و از سمت شما نیست.

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

تحقیق حاضر اهمیت استفاده از معماهایی را به ما نشان می‌دهد که بدون نیاز به دانش پیشرفته، بتوانند توانمندی‌های استدلالی هوش مصنوعی را به خوبی به چالش بکشند. معماهای Sunday Puzzle، که به صورت هفتگی توسط Will Shortz در NPR ارائه می‌شوند، به گونه‌ای طراحی شده‌اند که حتی برای ذهن‌های تیزبین انسانی نیز دشوار باشند. این ویژگی‌ها، پژوهشگران را بر آن داشت تا از این معماها به عنوان معیاری برای سنجش رفتارهای استدلالی مدل‌های هوش مصنوعی استفاده کنند. در این پژوهش، مشاهده شد که برخی از مدل‌ها، مانند DeepSeek’s R1، در مواجهه با سوالات سخت گاهی به نوعی «تسلیم» شده و به جای ارائه پاسخی صحیح، اظهار ناامیدی می‌کنند؛ رفتاری که بسیار انسانی به نظر می‌رسد.

مرتبط مقالات

محتوای هوش مصنوعی در اینستاگرام؛ آینده غیرقابل‌اعتماد در 2026

پشت پرده رقابت دولت و بخش خصوصی در بازار احراز هویت آنلاین

هوش مصنوعی آب زمین را مصرف می‌کند ولی کسی صدایش درنمی‌آید

این پژوهش نکات جالبی از جمله فرآیند تفکری پیچیده مدل‌های استدلالی را روشن می‌کند؛ فرآیندی که در آن مدل‌ها قبل از ارائه پاسخ، به دقت گزینه‌های خود را بررسی و حتی گاهی پس از اعلام پاسخ، در جستجوی گزینه‌های بهتری می‌گردند. این رفتارها، اگرچه نشان از توانایی‌های عمیق در تحلیل دارند، اما همچنین نقاط ضعفی مانند تأخیر در ارائه پاسخ و ارائه توضیحات غیرمنطقی را نیز به همراه دارند. علاوه بر این، پژوهشگران به محدودیت‌هایی چون محوریت زبانی و فرهنگی معماها اشاره کرده‌اند؛ چرا که استفاده از معماهای انگلیسی-آمریکایی می‌تواند زمینه‌های تطبیق‌پذیری کمتری را برای سنجش عملکرد مدل‌های هوش مصنوعی در بسترهای چندزبانه فراهم آورد.

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

با توجه به نتایج به دست آمده، مدل o1 به عنوان برترین عملکرد با نمره ۵۹ درصد برجسته شده است؛ در حالی که مدل‌های دیگر امتیازهای پایین‌تری کسب کرده‌اند. این نتایج به ما می‌آموزد که آزمون‌های استدلالی باید از ابعاد گسترده‌تری برخوردار باشند تا بتوانند جنبه‌های انسانی و خلاقانه هوش مصنوعی را به شیوه‌ای کامل منعکس کنند. پژوهشگران بر این باورند که ارائه بنچمارکی که نیاز به دانش پیشرفته نداشته باشد، می‌تواند افق‌های نوینی را برای پژوهشگران از رشته‌های مختلف باز کند و زمینه‌ساز توسعه راه‌حل‌های بهینه‌تر در آینده شود. این امر به ویژه در زمانی که هوش مصنوعی در زندگی روزمره نفوذ بیشتری پیدا می‌کند، اهمیت دوچندان پیدا می‌کند؛ زیرا درک عمومی از قابلیت‌ها و محدودیت‌های این فناوری می‌تواند به تصمیم‌گیری‌های آگاهانه‌تر در سطوح مختلف کمک کند.

عضویت در خبرنامه نت باز 360

هر تریلر جدید، هر ابزار هوش مصنوعی و هر نقد جذاب، مستقیم در ایمیلت! 🎬 همین حالا عضو خبرنامه شو.

لطفاَ برای وارد شدن به گفتگو وارد شوید

جدیدترین‌های فیلم و سریال

پیشنهاد فیلم پدران و دختران (Fathers and Daughters 2015)

پیشنهاد فیلم پدران و دختران (Fathers and Daughters 2015)

1404-10-17
فیلم خانه عروسکی (Dollhouse 2025)

پیشنهاد فیلم خانه عروسکی (Dollhouse 2025)؛ فیلم ترسناک ژاپنی

1404-10-17
فیلم جنگجوی مرانتا (Merantau 2009)

پیشنهاد فیلم جنگجوی مرانتا (Merantau 2009)؛ قصه یودا و آستری

1404-10-17
Avengers: Doomsday

Avengers: Doomsday؛ راز بازگشت مگنیتو و پروفسور ایکس فاش شد

1404-10-17
معرفی و داستان فیلم زیبایی از رنج (Beauty from Pain 2025)

معرفی و داستان فیلم زیبایی از رنج (Beauty from Pain 2025)

1404-10-16
فیلم وی مثل وندتا (V for Vendetta 2005)

پیشنهاد فیلم وی مثل وندتا (V for Vendetta 2005)؛ جنگ آزادی در انگلستان

1404-10-16
فیلم گروه کر (The Choral 2025)

پیشنهاد فیلم گروه کر (The Choral 2025)؛ نجات موسیقی در دل جنگ

1404-10-16
لیست مورد انتظارترین فیلم های 2026؛ از Toy Story 5 تا Werewolf

لیست مورد انتظارترین فیلم های 2026؛ از Toy Story 5 تا Werewolf

1404-10-16
پیشنهاد فیلم ترکیه ای دو دنیا یک آرزو 2025؛ با بازی هانده ارچل

پیشنهاد فیلم ترکیه ای دو دنیا یک آرزو 2025؛ با بازی هانده ارچل

1404-10-15
پیشنهاد فیلم سینمایی شرور برای همیشه (Wicked: For Good 2025)

پیشنهاد فیلم سینمایی شرور برای همیشه (Wicked: For Good 2025)

1404-10-15
فیلم آزادی‌ خواه (The Liberator 2013)

پیشنهاد فیلم آزادی‌ خواه (The Liberator 2013)؛ نبرد بولیوار

1404-10-15
سریال Wonder Man آنچه مارول در تریلر جدید لو داد! + تریلر

سریال Wonder Man 2026: آنچه مارول در تریلر لو داد! + ویدیو

1404-10-12
فیلم کره ای اولین سفر (The First Ride 2025)

پیشنهاد فیلم کره ای اولین سفر (The First Ride 2025)؛ یک کمدی ماجراجویانه کره‌ای

1404-10-11
فیلم آب‌ های تیره (Dark Waters 2019)

پیشنهاد فیلم آب‌ های تیره (Dark Waters 2019)؛ نبرد عدالت در برابر غول‌های شیمیایی

1404-10-11
فیلم کمدی افرادی که در عروسی از آنها متنفریم 2022

پیشنهاد فیلم کمدی افرادی که در عروسی از آنها متنفریم 2022

1404-10-11
فیلم حقیقت و خیانت (Truth Treason 2025)

معرفی فیلم حقیقت و خیانت (Truth Treason 2025)؛ روایت هلموت هوبنر

1404-10-11
فیلم جنگی جنگلی کوهستانی

11 فیلم جنگی جنگلی کوهستانی؛ بهترین آثار اکشن و هیجان‌انگیز

1404-10-11
فیلم آخرین وایکینگ (The Last Viking 2025)

پیشنهاد فیلم آخرین وایکینگ (The Last Viking 2025)؛ مدس میکلسن

1404-10-11
فیلم سینمایی خنده دار ایرانی قدیمی شاد

معرفی و داستان 15 فیلم سینمایی خنده دار ایرانی قدیمی شاد

1404-10-10
پیشنهاد فیلم سگ تازی (Greyhound 2020)؛ نبرد در آتلانتیک

پیشنهاد فیلم سگ تازی (Greyhound 2020)؛ نبرد در آتلانتیک

1404-10-08

دانلود اپلیکیشن نت باز 360

اپلیکیشن نت باز 360

NetBaz360

ما در نت باز 360 به‌دنبال ساختن یک جامعه هستیم؛ جامعه‌ای از آدم‌های دقیق، مشتاق، تحلیل‌گر و آینده‌نگر. اگر ذهن پرسش‌گر و تحلیل‌گری دارید، اگر اخبار، آموزش و ترندهای روز را نه‌فقط برای دانستن، بلکه برای فهمیدن می‌خواهید، نت باز 360 را دنبال کنید. اینجا قرار نیست صرفاً به شما اطلاعات بدهیم؛ اینجا با شما فکر می‌کنیم، مسیر می‌سازیم و هر روز یک گام از دنیای فردا را کشف می‌کنیم. بنابراین، رسانه ما را نه برای آن‌چه هست، بلکه برای آن‌چه می‌شود خلق کرد، دنبال کنید.

نوشته‌های تازه

  • اینترنت ملی در ایران؛ امتحان بزرگ 200 ساعته دی ماه 1404
  • اینترنت ملی فعال شد؛ 3 مرحله تا بازگشت اینترنت جهانی
  • بهترین فیلم های صحنه دار | معرفی 10 فیلم صحنه‌دار بزرگسالانه
  • Character.AI زیر تیغ قانون؛ پایان آزادی بی‌قید AI در 2026؟
  • دستیار هوش مصنوعی فورد: خودرو به هم‌سفر دیجیتال تبدیل می‌شود

لینک مفید

تبلیغات در نت باز 360

درباره نت باز 360

posts sitemap

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
    • پیشنهاد فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مینی‌چرا
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • دایرکتوری ابزارهای هوش مصنوعی
  • اپلیکیشن

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.