نت‌باز 360
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
    • پیشنهاد فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مینی‌چرا
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • دایرکتوری ابزارهای هوش مصنوعی
  • اپلیکیشندانلود
تبلیغات
یکشنبه 20 مهر 1404
بدون نتیجه
مشاهده تمام نتایج
نت‌باز 360
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
    • پیشنهاد فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مینی‌چرا
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • دایرکتوری ابزارهای هوش مصنوعی
  • اپلیکیشندانلود
بدون نتیجه
مشاهده تمام نتایج
نت‌باز 360
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی ابزارها و پلتفرم‌ها
Gemini 2.5 Computer Use

همه چیز درباره Gemini 2.5 Computer Use؛ دستیار مرورگرمحور

توسط تحریریه نت باز 360
1404-07-16
در ابزارها و پلتفرم‌ها
مدت زمان مطالعه: 5 دقیقه

گوگل با معرفی مدل جدید Gemini 2.5 Computer Use بار دیگر مرزهای تعامل هوش مصنوعی با دنیای واقعی را جابه‌جا کرده است. این نسخه از خانواده Gemini به شکلی طراحی شده که می‌تواند مانند یک کاربر واقعی، درون مرورگر وب حرکت کند، فرم‌ها را پر کند، متن تایپ کند و حتی کارهایی مانند افزودن محصول به سبد خرید یا مرور صفحات خبری را انجام دهد.

این قابلیت جدید، نه‌تنها آینده‌ی اتوماسیون را متحول می‌کند، بلکه آغازگر نسلی تازه از عامل‌های هوشمند مبتنی بر مرورگر است که بدون نیاز به API یا دسترسی سیستمی، مستقیماً با رابط‌های کاربری انسانی تعامل دارند. در ادامه، نگاهی دقیق‌تر به توانایی‌ها و اهمیت استراتژیک این مدل می‌اندازیم.

Gemini 2.5 Computer Use چیست؟

Gemini 2.5 Computer Use

مرتبط مقالات

بهترین ابزارهای هوش مصنوعی؛ راهنمای انتخاب هوشمندانه در 2025

ساخت ویدیوهای واقعی با Grok Imagine v0.9

AgentKit: تحول ساخت ایجنت‌های هوش مصنوعی در کمتر از 10 دقیقه

Gemini 2.5 Computer Use نسخه‌ای پیشرفته از مدل‌های هوش مصنوعی گوگل است که برای کار در محیط مرورگر توسعه یافته. این مدل با استفاده از درک بصری و استدلال چندمرحله‌ای، قادر است درخواست کاربر را تحلیل و در رابط‌های واقعی انسانی اجرا کند.
به‌عنوان مثال، می‌تواند فرم‌های ثبت‌نام را پر کند، متنی در فیلدها وارد کرده و حتی دکمه ارسال را بفشارد — درست مثل یک انسان.

تفاوت کلیدی Gemini 2.5 Computer Use با مدل‌های قبلی

برخلاف مدل‌های سنتی هوش مصنوعی که برای تعامل به API نیاز دارند، Gemini 2.5 Computer Use در محیط‌های بدون API هم کار می‌کند.
این ویژگی به آن اجازه می‌دهد مستقیماً با وب‌سایت‌ها یا اپلیکیشن‌های تحت‌وبی که برای انسان طراحی شده‌اند تعامل کند. گوگل از این فناوری در پروژه‌های آزمایشی خود مانند AI Mode و Project Mariner نیز بهره گرفته است.

کاربردهای عملی Gemini 2.5 Computer Use در دنیای واقعی

گوگل می‌گوید این مدل می‌تواند برای تست رابط کاربری (UI Testing)، اجرای وظایف مرورگرمحور، و حتی انجام فعالیت‌هایی مانند مرور سایت‌های خبری یا انجام بازی‌هایی مثل 2048 مورد استفاده قرار گیرد.
کاربران توسعه‌دهنده می‌توانند عملکرد این مدل را از طریق Google AI Studio و Vertex AI تجربه کنند. همچنین، دموهای آن در پلتفرم Browserbase در دسترس است که کاربران می‌توانند رفتار هوش مصنوعی را به‌صورت زنده تماشا کنند.

برتری Gemini 2.5 Computer Use نسبت به رقبا

Gemini 2.5 Computer Use

گوگل اعلام کرده است که Gemini 2.5 Computer Use در تست‌های وب و موبایل عملکرد بهتری نسبت به مدل‌های مشابه از OpenAI (با ChatGPT Agent) و Anthropic (Claude Computer Use) داشته است.
با این حال، این مدل فعلا فقط به مرورگر دسترسی دارد و کنترل سیستم‌عامل دسکتاپ را در اختیار ندارد.
در حال حاضر از 13 اکشن اصلی مانند باز کردن مرورگر، تایپ متن، و کشیدن و رها کردن (Drag & Drop) پشتیبانی می‌کند.

دموی رسمی و عملکرد واقعی Gemini 2.5 Computer Use

گوگل برای نمایش توانایی‌های مدل جدید، ویدیوهایی منتشر کرده که در آن Gemini 2.5 Computer Use در حال اجرای وظایف مختلف دیده می‌شود.
این ویدیوها 3 برابر سریع‌تر از حالت واقعی نمایش داده شده‌اند تا فرایند اجرای دستورها در زمان کوتاه‌تری قابل مشاهده باشد.
عملکرد نرم، تصمیم‌گیری منطقی و هماهنگی دقیق میان بینایی و عمل، از مهم‌ترین نقاط قوت این مدل هستند.

ویژگی‌های کلیدی Gemini 2.5 Computer Use

ویژگی

توضیحات
نوع مدل

مدل هوش مصنوعی مرورگرمحور از خانواده Gemini

قابلیت‌ها

درک بصری، استدلال، تعامل با رابط‌های انسانی
دسترسی

از طریق Google AI Studio و Vertex AI

تعداد اکشن‌های پشتیبانی‌شده

13 اکشن اصلی
نمونه پروژه‌ها

AI Mode، Project Mariner

محدودیت فعلی

فقط دسترسی مرورگر (نه محیط دسکتاپ)
نسخه دمو

قابل مشاهده در Browserbase

عملکرد در تست‌ها

برتر از ChatGPT Agent و Claude Computer Use

تحلیل‌گران هوش مصنوعی معتقدند معرفی Gemini 2.5 Computer Use نقطه عطفی در مسیر توسعه عامل‌های خودکار (AI Agents) است.
این مدل می‌تواند نحوه تعامل ماشین‌ها با اینترنت را تغییر دهد و به شکل هوشمندانه‌تری از واسطه‌های انسانی عبور کند.
در آینده نزدیک، گوگل احتمالاً کنترل سطح سیستم‌عامل و تعامل‌های چندابزاره را نیز به آن اضافه خواهد کرد.

پیش‌بینی می‌شود در 6 ماه آینده، نسخه‌ای از این فناوری به محصولات مصرفی گوگل مانند مرورگر Chrome و Google Assistant نیز راه پیدا کند.

جمع‌بندی

مدل Gemini 2.5 Computer Use نه‌تنها نشان‌دهنده‌ی قدرت روزافزون هوش مصنوعی در درک محیط‌های انسانی است، بلکه پایه‌گذار عصری تازه از تعامل میان انسان و ماشین محسوب می‌شود.
گوگل با این حرکت، رقابت را برای OpenAI و Anthropic دشوارتر کرده و یک گام بزرگ در مسیر «هوش مصنوعی تعاملی واقعی» برداشته است.

سوالات متداول (FAQ)

  1. مدل Gemini 2.5 Computer Use چه تفاوتی با ChatGPT Agent دارد؟
    این مدل فقط از طریق مرورگر عمل می‌کند و به سیستم‌عامل یا فایل‌های محلی دسترسی ندارد، درحالی‌که ChatGPT Agent کنترل گسترده‌تری دارد.
  2. آیا Gemini 2.5 Computer Use برای عموم کاربران در دسترس است؟
    فعلاً خیر؛ فقط توسعه‌دهندگان از طریق Google AI Studio و Vertex AI می‌توانند به آن دسترسی داشته باشند.
  3. گوگل چه زمانی نسخه عمومی مدل Gemini 2.5 Computer Use را عرضه می‌کند؟
    هنوز زمان مشخصی اعلام نشده، اما انتظار می‌رود در نیمه اول سال 2026 عرضه‌ی عمومی انجام شود.
  4. آیا Gemini 2.5 Computer Use می‌تواند جایگزین تست‌های دستی UI شود؟
    تا حد زیادی بله. این مدل می‌تواند بخش بزرگی از تست‌های تکراری رابط کاربری را به‌صورت خودکار انجام دهد.

عضویت در خبرنامه نت باز 360

هر تریلر جدید، هر ابزار هوش مصنوعی و هر نقد جذاب، مستقیم در ایمیلت! 🎬 همین حالا عضو خبرنامه شو.

لطفاَ برای وارد شدن به گفتگو وارد شوید

دانلود اپلیکیشن نت باز 360

اپلیکیشن نت باز 360

نوشته‌های تازه

پیشنهاد فیلم باکره چهل‌ ساله (The 40-Year-Old Virgin)

پیشنهاد فیلم اتوبوس گمشده (The Lost Bus)؛ نجات در دل آتش

پیشنهاد فیلم هفته؛ 15 فیلم با داستان‌ های تاثیرگذار

پیشنهاد فیلم The Naked Gun (2025)؛ بازگشتی پرهیجان

NetBaz360

ما در نت باز 360 به‌دنبال ساختن یک جامعه هستیم؛ جامعه‌ای از آدم‌های دقیق، مشتاق، تحلیل‌گر و آینده‌نگر. اگر ذهن پرسش‌گر و تحلیل‌گری دارید، اگر اخبار، آموزش و ترندهای روز را نه‌فقط برای دانستن، بلکه برای فهمیدن می‌خواهید، نت باز 360 را دنبال کنید. اینجا قرار نیست صرفاً به شما اطلاعات بدهیم؛ اینجا با شما فکر می‌کنیم، مسیر می‌سازیم و هر روز یک گام از دنیای فردا را کشف می‌کنیم. بنابراین، رسانه ما را نه برای آن‌چه هست، بلکه برای آن‌چه می‌شود خلق کرد، دنبال کنید.

نوشته‌های تازه

  • تحول دیجیتال بزرگ ایران؛ عبور از سیم مسی به فیبر نوری
  • اپلیکیشن Sora به گوگل‌پلی آمد؛ هنوز قابل نصب نیست!
  • وی‌پی‌ان رایگان با بدافزار خطرناک، حساب‌های بانکی در معرض تهدید
  • خداحافظی بی‌ام‌و با 3 مدل محبوب 2025
  • OpenAI به منتقدان هوش مصنوعی احضاریه فرستاد!

لینک مفید

تبلیغات در نت باز 360

درباره نت باز 360

دایرکتوری ابزارهای هوش مصنوعی

posts sitemap

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • خانه
  • تکنولوژی
    • هوش مصنوعی
      • اخبار هوش مصنوعی
      • آموزش هوش مصنوعی
      • ابزارها و پلتفرم‌ها
      • پروژه‌ها
    • تکنولوژی
    • VR/AR
    • خودرو
    • فناوری‌های پوشیدنی (گجت)
  • فیلم و سریال
    • فیلم و سریال
    • نقد و بررسی فیلم و سریال
    • پیشنهاد فیلم و سریال
  • نت باز پلاس
    • تحلیل و بررسی تخصصی
    • پزشکی و بهداشت
    • تجارت و بازاریابی
    • امنیت
    • گزارش ویژه
    • مینی‌چرا
    • مقالات همکاری
    • مسائل اجتماعی و اخلاقی
    • اطلاعات بیشتر
  • دایرکتوری ابزارهای هوش مصنوعی
  • اپلیکیشن

تمام حقوق مادی و معنوی سایت «نت باز 360» محفوظ است.