Google Docs اکنون با کمک Gemini میتواند نسخههای صوتی از اسناد شما تولید کند؛ کاربرها میتوانند بین صداهای مختلف انتخاب کنند و سرعت پخش را تغییر دهند. این قابلیت هم برای نویسنده سند و هم برای خوانندگان مشترک در دسترس است و از منوی Tools گزینهی Audio > Listen to this tab فعال میشود.
فعلاً تولید صوت فقط به زبان English و روی دسکتاپ امکانپذیر است و گوگل انتشار این ویژگی را به کاربران Workspace با پلانهای business، enterprise و education و همچنین مشترکین AI Pro و Ultra محدود کرده است.
Google Docs چطور کار میکند؟
در نسخه صوتی Google Docs برای ساختن نسخه صوتی یک سند کافی است در بالای صفحه به Tools بروید و Audio سپس Listen to this tab را انتخاب کنید. گوگل همچنین یک دکمهٔ قابلِ درج ارائه داده که نویسنده میتواند از طریق Insert > Audio آن را داخل سند قرار دهد تا خوانندگان با کلیک پخش را شروع کنند.
Gemini متن را پردازش میکند و خروجی را با صدای طبیعی میسازد؛ رابط کاربری یک پلیر شناور ساده نمایش میدهد تا کنترلهای پخش در دسترس باشند.
شخصیسازی صدا و سرعت پخش در Google Docs
کاربران میتوانند از بین چند «صدای هوش مصنوعی» انتخاب کنند و سرعت پخش (faster/slower) را تنظیم نمایند. این امکان برای گوش دادن طولانی یا بررسی نوشتهها برای کشف اشتباهات تایپی بسیار سودمند است.
تغییر صدای انتخابشده و سرعت پخش بهسرعت در پلیر اعمال میشود و نویسنده هم میتواند پیشفرضهایی در هنگام درج دکمهٔ صوتی تعیین کند.
چطور دکمهٔ صوتی Google Docs را در سند قرار دهیم؟
برای گذاشتن دکمهٔ گوش دادن داخل سند: Insert → Audio buttons → Listen to tab را بزنید و بعد دکمه را کلیک کنید تا برچسب، رنگ و اندازه را تغییر دهید. همچنین میتوان با انتخاب یک بخش و وارد کردن @ و انتخاب Listen to tab یک «audio chip» داخل متن اضافه کرد. این راهکار برای اسناد اشتراکی بسیار کارآمد است.
محدودیتها و شرایط دسترسی Google Docs
در نسخهٔ فعلی تولید صوت تنها برای متون English و روی دسکتاپ فراهم است؛ نسخهٔ موبایل و پشتیبانی از زبانهای دیگر احتمالاً در آینده اضافه خواهد شد. این ویژگی فعلاً برای کاربران Workspace با پلانهای business/enterprise/education و مشترکان AI Pro و Ultra در حال انتشار است.
کاربردها و مزایای نسخه صوتی Google Docs
این امکان به ویژه برای: مرور سریع گزارشها در مسیر رفتوآمد، بازبینی متنها هنگام ویرایش (proofreading)، دسترسی بهتر برای کاربران با نیازهای دسترسپذیری و تبدیل اسناد به محتوای صوتی برای مصرف چندوظیفهای مفید است. همچنین میتواند به تولید «AI podcasts» داخلی برای تیمها تبدیل شود.
این حرکت گوگل یک گام منطقی و کاربردی در مسیر تلفیق Gemini با ابزارهای روزمرهٔ کاری است. افزودن خروجی صوتی هم به تجربهٔ دسترسپذیری کمک میکند و هم زماناحتیاجِ کاربران حرفهای را کاهش میدهد؛ در کوتاهمدت تیمهای محتوا و آموزش از این قابلیت بیشترین بهره را خواهند برد.
پیشبینی میشود در 6–12 ماه آینده شاهد سه توسعهٔ کلیدی باشیم: اضافه شدن زبانهای بیشتر (بهخصوص Spanish، French و Portuguese)، توسعهٔ تجربهٔ موبایل با پلیر بومی در اپهای Docs، و قابلیت تنظیم صدای سفارشی یا آپلود voice model برای برندها که به تولید پادکستهای سازمانی منجر میشود. این مسیر با منطق تجاریِ گوگل برای ارزشگذاری روی Workspace همخوانی دارد و احتمالاً محدودیت دسترسی به پلانهای تجاری در ابتدا نگه داشته میشود تا مدل کسبوکاری حفظ شود.
در عین حال باید مراقب ریسکهایی مثل تولید نادرست تلفظِ اسامی خاص یا خطا در خوانش جداول و فرمولها باشیم؛ این موارد میتوانند تجربهٔ شنیداری را کاهش دهند مگر اینکه گوگل در نسخههای بعدی روی parsing ساختارهای پیچیده تمرکز کند.
جمعبندی
Google Docs با کمک Gemini اکنون میتواند متنها را به صوت طبیعی تبدیل کند؛ کاربران میتوانند از منوی Tools یا با درج دکمهٔ صوتی به فایلها گوش دهند، تنظیمات صدا و سرعت را تغییر دهند و فعلاً این قابلیت روی دسکتاپ و برای زبان English و برای پلانهای Workspace خاص و مشترکان AI Pro/Ultra در دسترس است. این تغییر هم به دسترسپذیری کمک میکند و هم یک مسیر تازه برای تولید و مصرف محتوا در فضای کاری ایجاد میکند.