در جلسه پرسشوپاسخ اخیر در r/ChatGPT، سم آلتمن و تیم GPT-5 با موجی از سؤالها درباره عملکرد نسخه جدید و درخواستهای بازگردانی GPT-4o روبهرو شدند. پرسشها از مشکلات فنی تا طنز «جرم چارت» را دربرمیگرفت و فضای AMA همزمان جدی و شوخ بود.
آلتمن وجود یک «روتر زمانواقعی» را بهعنوان ویژگی جدید توضیح داد که انتخاب مدل مناسب برای هر پرسش را برعهده دارد، اما اختلال در این روتر باعث شد کاربران عملکرد GPT-5 را «خارقالعاده ضعیفتر» از 4o حس کنند. تیم وعده داد اصلاحات فنی، شفافسازی دربارهٔ اینکه کدام مدل پاسخ میدهد و افزایش محدودیت نرخ برای کاربران Plus در راه است.
جلسه AMA و محوریت سؤالات
در AMA کاربران عمدتاً دو موضوع را تکرار کردند: کیفیت پاسخها در مقایسه با 4o و آنچه بهعنوان «جرم چارت» شناخته شد. پرسشها نشان داد کاربران سریعاً رفتار مدل را با تجربیات قبلیشان مقایسه میکنند و انتظار ثبات عملکرد دارند. آلتمن و تیم با صداقت به بعضی اشکالات اعتراف کردند و قول پیگیری دادند.
مشکل «روتر زمانواقعی» و اثر آن بر کیفیت
یکی از قابلیتهای کلیدی GPT-5، یک روتر زمانواقعی است که بین پاسخ سریع یا «فکر کردن» طولانیتر تصمیم میگیرد. آلتمن توضیح داد که «دیروز یک sev رخ داد و autoswitcher برای بخشی از روز از کار افتاد و نتیجه این شد که GPT-5 خیلی احمق بهنظر رسید.»
بدون کارکرد درست روتر، سیستم نتوانست مدل مناسب را انتخاب کند و تجربهٔ کاربران تضعیف شد. تیم اعلام کرده است که مرزبندی تصمیمگیری (decision boundary) اصلاح خواهد شد تا انتخاب مدل درست با فرکانس بالاتری اتفاق بیفتد.
فشار کاربران برای بازگردانی GPT-4o
پس از نارضایتی کاربران، درخواست گستردهای برای بازگرداندن 4o مطرح شد. آلتمن نوشت که تیم «در حال بررسی اجازه دادن به کاربران Plus برای ادامه استفاده از 4o» است و دادههای بیشتری دربارهٔ «مساویسازی مزایا و معایب» جمعآوری میکنند. این موضع نشان میدهد اوپنایآی تلاش میکند بین نوآوری و حفظ تجربهٔ کاربر تعادل برقرار کند.
«جرم چارت» — از خنده تا دغدغه
نمایش یک چارت نادرست در ارائه زنده میلهای کوتاهتر با عدد کمتر اما میلهای بلندتر نمایش داده شد به سرعت به موضوع طنزآمیزی تبدیل شد که کاربران آن را «chart crime» خواندند. آلتمن خود آن را «mega chart screwup» نامید، اگرچه بلاگپست همراه گزارش با نمودارهای صحیح منتشر شده بود. حتی منتقدانی که به GPT-5 نظر مثبتی داشتند، اشاره کردند تبدیل داده به جدول مثال روشنی از ضعف فعلی مدل است.
وعدهها و اقدامهای فوری اوپنایآی
آلتمن وعده داد که: روتر را پایدار خواهند کرد، مرزبندی تصمیمگیری را تغییر میدهند، دربارهٔ مدل پاسخگو شفافیت بیشتری ایجاد میکنند و «محدودیت نرخ را برای کاربران Plus دو برابر» خواهند کرد. این وعدهها هم برای حل مشکلات فنی و هم برای دادن زمان بیشتر به کاربران جهت سازگاری با مدل جدید مطرح شدهاند.
اختلال اولیه در روتر نشان میدهد که انتقال به معماریهای چندمدلی همراه با مدیریت خودکار تصمیمگیرنده، چالشهای عملیاتی جدیدی دارد. وقتی تصمیمگیری بین «سرعت» و «دقت/تفکر» اتوماتیک شود، دو دسته ریسک پدید میآیند: خطاهای انتخاب مدل و کاهش شفافیت برای کاربر. آلتمن با اشاره به شفافتر کردن اینکه «کدام مدل پاسخ میدهد» در واقع میپذیرد که فقدان شفافیت یکی از نقاط ضعف فعلی است.
-
در کوتاهمدت، اولویت تیم مهندسی احتمالاً رفع باگهای روتر و بهبود مرزبندی تصمیمگیری است تا کاربر کمتر تجربهٔ «هوش پایینتر» را ببیند.
-
اگر دادههای جمعآوریشده نشان دهد که 4o در برخی کلاسهای پرسش عملکرد بهتری دارد، اوپنایآی ممکن است بهصورت دائمی یا موقتی امکان بازگشت یا انتخاب دستی بین مدلها را برای Plus فراهم کند.
-
اصلاحات رابط کاربری برای نمایش مدل پاسخدهنده و همچنین ابزارهای تشخیصی برای توسعهدهندگان و کاربران پرو، کاهندهٔ قابلتوجهی در شک و تردید خواهد بود.
-
از منظر برند، «جرم چارت» بهسرعت به یک میم تبدیل شد؛ اوپنایآی باید ضمن اصلاح فنی، با شفافیت ارتباطی تصویر اعتماد را بازسازی کند.
-
بلندمدت، موفقیت GPT-5 تابعی از توانایی شرکت در مدیریت پیچیدگی سیستمهای چندمدلی و توانایی توضیحپذیری (explainability) خروجیها برای کاربران خواهد بود.
جمعبندی
در AMA، آلتمن اختلال روزهای اول در «روتر زمانواقعی» را دلیل ظاهر ضعیف GPT-5 خواند، وعدههایی برای اصلاح مرزبندی تصمیمگیری، شفافسازی مدل پاسخدهنده، افزایش نرخ برای کاربران Plus و بررسی بازگرداندن GPT-4o داد؛ در کنار این اصلاحات، جنجال «جرم چارت» یادآور این است که هم خطاهای فنی و هم خطاهای ارائهای میتوانند ضربهٔ نامتناسبی به اعتماد کاربران بزنند. نهایتاً، آیندهٔ تجربهٔ کاربری GPT-5 به سرعت برطرف شدن باگها، شفافیت انتخاب مدل و تعادل هوشمندانه بین نوآوری و ثبات بستگی دارد.