نت باز 360
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
      • سرگرمی و خلاقیت
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • اپلیکیشندانلود
چهارشنبه 26 شهریور 1404
بدون نتیجه
مشاهده تمام نتایج
نت باز 360
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
      • سرگرمی و خلاقیت
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • اپلیکیشندانلود
بدون نتیجه
مشاهده تمام نتایج
نت باز 360
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی گزارش ویژه
معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

تحریریه نت باز 360 توسط تحریریه نت باز 360
1403-11-29
در گزارش ویژه
مدت زمان مطالعه: 1 دقیقه
2
اشتراک گذاری در فیسبوکاشتراک گذاری در توییتراشتراک گذاری در تلگرام

یک گروه پژوهشگر از دانشگاه‌ها و استارتاپ‌های معتبر تصمیم گرفتند با استفاده از حدود ۶۰۰ معمای Sunday Puzzle، مرزهای استدلال مدل‌های هوش مصنوعی را بسنجند. آن‌ها نشان دادند که چگونه مدل‌هایی همچون o1 و DeepSeek’s R1، در مواجهه با معماهای غیرمرتبط با دانش تخصصی عمیق، به شیوه‌ای شبیه به واکنش‌های انسانی عمل می‌کنند؛ از جمله ابراز ناامیدی و ارائه پاسخ‌های نادرست در مواقع بحرانی. این یافته‌ها نه تنها دید تازه‌ای نسبت به ارزیابی هوش مصنوعی ارائه می‌دهد، بلکه ضرورت استفاده از بنچمارک‌هایی را برجسته می‌کند که برای عموم قابل فهم و استفاده باشند.

تجربه شما از سرعت بارگذاری سایت در اولین بازدید چگونه بود؟

نظر شما کمک می‌کنه سرعت و کیفیت سایت رو بهتر کنیم 🙏 ممنون که برای ما ارزشمندید. اگر پیام «خطا در ثبت رأی» دیدید، نگران نباشید ✅ رأی شما ثبت شده؛ این پیام معمولا به‌خاطر اختلال لحظه‌ای اینترنت یا تازه‌سازی صفحه نشون داده میشه.

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

تحقیق حاضر اهمیت استفاده از معماهایی را به ما نشان می‌دهد که بدون نیاز به دانش پیشرفته، بتوانند توانمندی‌های استدلالی هوش مصنوعی را به خوبی به چالش بکشند. معماهای Sunday Puzzle، که به صورت هفتگی توسط Will Shortz در NPR ارائه می‌شوند، به گونه‌ای طراحی شده‌اند که حتی برای ذهن‌های تیزبین انسانی نیز دشوار باشند. این ویژگی‌ها، پژوهشگران را بر آن داشت تا از این معماها به عنوان معیاری برای سنجش رفتارهای استدلالی مدل‌های هوش مصنوعی استفاده کنند. در این پژوهش، مشاهده شد که برخی از مدل‌ها، مانند DeepSeek’s R1، در مواجهه با سوالات سخت گاهی به نوعی «تسلیم» شده و به جای ارائه پاسخی صحیح، اظهار ناامیدی می‌کنند؛ رفتاری که بسیار انسانی به نظر می‌رسد.

مرتبط مقالات

آیا Suchir Balaji کشته شد؟ سام آلتمن پاسخ داد

کشف کن: آیا تا 2035 عینک هوشمند جای گوشی را می‌گیرد؟

محدودیت تازه X برای آموزش مدل‌های هوش مصنوعی

این پژوهش نکات جالبی از جمله فرآیند تفکری پیچیده مدل‌های استدلالی را روشن می‌کند؛ فرآیندی که در آن مدل‌ها قبل از ارائه پاسخ، به دقت گزینه‌های خود را بررسی و حتی گاهی پس از اعلام پاسخ، در جستجوی گزینه‌های بهتری می‌گردند. این رفتارها، اگرچه نشان از توانایی‌های عمیق در تحلیل دارند، اما همچنین نقاط ضعفی مانند تأخیر در ارائه پاسخ و ارائه توضیحات غیرمنطقی را نیز به همراه دارند. علاوه بر این، پژوهشگران به محدودیت‌هایی چون محوریت زبانی و فرهنگی معماها اشاره کرده‌اند؛ چرا که استفاده از معماهای انگلیسی-آمریکایی می‌تواند زمینه‌های تطبیق‌پذیری کمتری را برای سنجش عملکرد مدل‌های هوش مصنوعی در بسترهای چندزبانه فراهم آورد.

معماهای NPR؛ آزمون توانمندی‌های استدلال هوش مصنوعی

با توجه به نتایج به دست آمده، مدل o1 به عنوان برترین عملکرد با نمره ۵۹ درصد برجسته شده است؛ در حالی که مدل‌های دیگر امتیازهای پایین‌تری کسب کرده‌اند. این نتایج به ما می‌آموزد که آزمون‌های استدلالی باید از ابعاد گسترده‌تری برخوردار باشند تا بتوانند جنبه‌های انسانی و خلاقانه هوش مصنوعی را به شیوه‌ای کامل منعکس کنند. پژوهشگران بر این باورند که ارائه بنچمارکی که نیاز به دانش پیشرفته نداشته باشد، می‌تواند افق‌های نوینی را برای پژوهشگران از رشته‌های مختلف باز کند و زمینه‌ساز توسعه راه‌حل‌های بهینه‌تر در آینده شود. این امر به ویژه در زمانی که هوش مصنوعی در زندگی روزمره نفوذ بیشتری پیدا می‌کند، اهمیت دوچندان پیدا می‌کند؛ زیرا درک عمومی از قابلیت‌ها و محدودیت‌های این فناوری می‌تواند به تصمیم‌گیری‌های آگاهانه‌تر در سطوح مختلف کمک کند.

عضویت در خبرنامه نت باز 360

هر تریلر جدید، هر ابزار هوش مصنوعی و هر نقد جذاب، مستقیم در ایمیلت! 🎬 همین حالا عضو خبرنامه شو.

پست قبلی

پیشرفت‌های اروپایی در مدل‌های زبانی متن‌باز

پست‌ بعدی

درک عمیق‌تر نیازهای حیوانات با هوش مصنوعی

مقالات مرتبط

آیا Suchir Balaji کشته شد؟ سام آلتمن پاسخ داد
گزارش ویژه

آیا Suchir Balaji کشته شد؟ سام آلتمن پاسخ داد

1404-06-22
دولت یا دیوار جدید فیلتر؟ وقتی وعده‌ها به بهانه دفتر گره می‌خورد
گزارش ویژه

دولت یا دیوار جدید فیلتر؟ وقتی وعده‌ها به بهانه دفتر گره می‌خورد

1404-06-17
کشف کن آیا تا 2035 عینک هوشمند جای گوشی را می‌گیرد؟
VR/AR

کشف کن: آیا تا 2035 عینک هوشمند جای گوشی را می‌گیرد؟

1404-06-03
وقتی AI پروپاگاندا را واقعی می‌سازد؛ گزارش و تحلیل
گزارش ویژه

وقتی AI پروپاگاندا را واقعی می‌سازد؛ گزارش و تحلیل | برای مطالعه وارد سایت شوید

1404-06-01
جمینای گوگل در حلقه خودتخریبی؛ من شکست‌خورده هستم
گزارش ویژه

جمینای گوگل در حلقه خودتخریبی؛ من شکست‌خورده هستم

1404-05-18
خبر ترسناک برای صاحبان سایت‌های خبری و مجله اینترنتی
گزارش ویژه

خبر ترسناک برای صاحبان سایت‌های خبری و مجله اینترنتی

1404-05-16
لطفاَ برای وارد شدن به گفتگو وارد شوید

دانلود اپلیکیشن نت باز 360

اپلیکیشن نت باز 360

توصیه شده.

فیلم دختر کفشدوزکی تماشای جدیدترین فصل با دوبله فارسی

فیلم دختر کفشدوزکی | تماشای جدیدترین فصل با دوبله فارسی

1404-03-07
تاخیر Live Translate در AirPods Pro 3

تاخیر Live Translate در AirPods Pro 3

1404-06-11

نوشته‌های تازه

Mijia Smart Neck Pillow Massager ماساژور جدید شیائومی

Mijia Smart Neck Pillow Massager ماساژور جدید شیائومی

1404-06-26
پیش‌ فروش کرمان موتور؛ از امروز چهارشنبه 26 شهریور 1404

پیش‌ فروش کرمان موتور؛ از امروز چهارشنبه 26 شهریور 1404

1404-06-26
آیا شغل شما قربانی بعدی هوش مصنوعی است؟

آیا شغل شما قربانی بعدی هوش مصنوعی است؟

1404-06-26
Grok 4؛ یک پروژه پرهزینه و جاه‌طلبانه

Grok 4؛ یک پروژه پرهزینه و جاه‌طلبانه

1404-06-26
سم آلتمن ChatGPT دیگر درباره خودکشی با نوجوانان صحبت نمی‌کند

سم آلتمن: ChatGPT دیگر درباره خودکشی با نوجوانان صحبت نمی‌کند

1404-06-26

نوشته‌های تازه فیلم و سریال

فیلم Pleasure بازنمایی پشت صحنه و واقعیت صنعت فیلم بزرگسال

فیلم Pleasure بازنمایی پشت صحنه و واقعیت صنعت فیلم بزرگسال

1404-06-25
لیست کامل فیلمهای شاهرخ خان + معرفی و داستان آنها

لیست کامل فیلمهای شاهرخ خان + معرفی و داستان آنها

1404-06-25
فیلم کره ای نیمه شب 2021 Midnight + معرفی و داستان

فیلم کره ای نیمه شب 2021 Midnight + معرفی و داستان

1404-06-24
فیلم در آغوش خون‌ آشام 2013 Embrace of the Vampire

فیلم در آغوش خون‌ آشام 2013 Embrace of the Vampire + معرفی و داستان

1404-06-24
فیلم قلب‌ های ارغوانی 2022؛ روایت عشق مسحورکننده

فیلم قلب‌ های ارغوانی 2022؛ روایت عشق مسحورکننده

1404-06-23
فیلم های کمدی ایرانی که ارزش دیدن دارند

30 عنوان از فیلم های کمدی ایرانی که ارزش دیدن دارند + معرفی و داستان

1404-06-23

پرطرفدار.

معرفی پرطرفدارترین سریال های تینیجری همجنسگرایی

معرفی پرطرفدارترین سریال های تینیجری همجنسگرایی

1404-06-22
کد اینترنت اضطراری همراه اول + راهنمای فوری

کد اینترنت اضطراری همراه اول + راهنمای فوری

1404-03-14
فیلم زندان زنان - Women`s Prison

فیلم زندان زنان – Women`s Prison | صحنه‌هایی که مخاطبان را شوکه کرد

1404-04-19
لیست سریال های بی ال؛ 12 انتخاب سریال های Boys love

لیست سریال های بی ال؛ 12 انتخاب سریال های Boys love

1404-06-17
10 فیلم سینمایی هندی عاشقانه جدید

10 فیلم سینمایی هندی عاشقانه جدید

1404-03-10

NetBaz360

ما در نت باز 360 به‌دنبال ساختن یک جامعه هستیم؛ جامعه‌ای از آدم‌های دقیق، مشتاق، تحلیل‌گر و آینده‌نگر. اگر ذهن پرسش‌گر و تحلیل‌گری دارید، اگر اخبار، آموزش و ترندهای روز را نه‌فقط برای دانستن، بلکه برای فهمیدن می‌خواهید، نت باز 360 را دنبال کنید. اینجا قرار نیست صرفاً به شما اطلاعات بدهیم؛ اینجا با شما فکر می‌کنیم، مسیر می‌سازیم و هر روز یک گام از دنیای فردا را کشف می‌کنیم. بنابراین، رسانه ما را نه برای آن‌چه هست، بلکه برای آن‌چه می‌شود خلق کرد، دنبال کنید.

دسته‌ها

  • VR/AR
  • آموزش هوش مصنوعی
  • ابزارها و پلتفرم‌ها
  • اخبار هوش مصنوعی
  • اطلاعات بیشتر
  • امنیت
  • پروژه‌ها
  • پزشکی و بهداشت
  • تجارت و بازاریابی
  • تحلیل و بررسی تخصصی
  • تکنولوژی
  • خودرو
  • سرگرمی و خلاقیت با هوش مصنوعی
  • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
  • گزارش ویژه
  • مسائل اجتماعی و اخلاقی
  • مقالات همکاری
  • مینی‌چرا
  • نقد و بررسی فیلم و سریال

لینک مفید

هارموآرا

آموزش بدن سازی

برج خلیفه چند متر است

آموزش آرایش ساده

مجله پزشکی سلامتیفای

posts sitemap

نوشته‌های تازه

  • Mijia Smart Neck Pillow Massager ماساژور جدید شیائومی
  • پیش‌ فروش کرمان موتور؛ از امروز چهارشنبه 26 شهریور 1404
  • آیا شغل شما قربانی بعدی هوش مصنوعی است؟
  • Grok 4؛ یک پروژه پرهزینه و جاه‌طلبانه
  • سم آلتمن: ChatGPT دیگر درباره خودکشی با نوجوانان صحبت نمی‌کند
  • بهترین راه‌های تبلیغات برای جذب مشتری | تبلیغات هدفمند و موثر
  • فیلم Pleasure بازنمایی پشت صحنه و واقعیت صنعت فیلم بزرگسال
  • معرفی فیلم 365 روز؛ فیلمی برای تماشا با پارتنرتون
  • درباره ما

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
      • سرگرمی و خلاقیت
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • اپلیکیشن

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.