گوگل تازه‌ترین مدل هوش مصنوعی خود برای ترجمه گفتاری را معرفی کرد؛ «جمنای ۳.۵ لایو ترنسلیت» مدلی است که با پشتیبانی از بیش از ۷۰ زبان، ترجمه زنده و پیوسته مکالمه را به شکلی طبیعی و نزدیک به صدای گوینده اصلی ممکن می‌سازد. این مدل نه‌تنها محتوای کلامی، بلکه آهنگ، سرعت و زیروبم صدای گوینده را نیز در خروجی حفظ می‌کند.

تفاوت اصلی این فناوری با سیستم‌های ترجمه سنتی در رویکرد پردازش آن است؛ در حالی که مدل‌های پیشین منتظر می‌ماندند تا گوینده جمله‌اش را کامل کند، جمنای ۳.۵ لایو ترنسلیت گفتار را همزمان با بیان پردازش می‌کند و تنها چند ثانیه از گوینده عقب می‌ماند. نتیجه این رویکرد، تجربه‌ای روان و بدون مکث‌های ناخوشایند است که حس گفت‌وگوی طبیعی را حفظ می‌کند.

این قابلیت از هم‌اکنون در اپلیکیشن گوگل ترنسلیت برای اندروید و iOS در حال انتشار است. کافی است هنگام اتصال هدفون، گزینه «ترجمه زنده» را در گوشه پایین‌چپ صفحه لمس کنید. در کنار این، نسخه اندروید اپلیکیشن از حالت جدیدی به نام «حالت شنیدن» بهره‌مند شده که کاربر بدون نیاز به هدفون، با گرفتن گوشی کنار گوش خود می‌تواند ترجمه را از طریق اسپیکر دنبال کند.

ChatGPT

گوگل اعلام کرده که این مدل به گوگل میت نیز راه پیدا خواهد کرد؛ سرویسی که پیش‌تر ترجمه گفتاری را تنها از پنج زبان پشتیبانی می‌کرد و محدود به خروجی انگلیسی بود. با این به‌روزرسانی، بیش از ۲۰۰۰ ترکیب زبانی در یک جلسه واحد پشتیبانی می‌شود. نسخه وب گوگل میت نیز از همین ماه به‌صورت آزمایشی دکمه‌ای اختصاصی برای فعال‌سازی سریع ترجمه گفتار دریافت خواهد کرد.

از نظر فنی، این مدل بدون تنظیم دستی از ورودی‌های چندزبانه پشتیبانی می‌کند و در محیط‌های پر سروصدا نیز عملکرد پایداری دارد. کاربردهای آن طیف گسترده‌ای از تماس‌های چندزبانه و جلسات کاری تا کلاس‌های درس و پخش‌های زنده را در بر می‌گیرد.

در حوزه ایمنی، گوگل تأکید کرده که تمام خروجی‌های صوتی تولیدشده توسط این مدل با فناوری «سینت‌آی‌دی» واترمارک‌گذاری می‌شوند؛ نشانه‌ای نامرئی که مستقیماً در فایل صوتی تعبیه می‌شود تا محتوای ساخته‌شده با هوش مصنوعی قابل ردیابی باشد و از انتشار اطلاعات نادرست جلوگیری کند. این اقدام بخشی از رویکرد کلی گوگل برای شفافیت در استفاده از هوش مصنوعی مولد است.

گوگل یادآور شده که ترجمه از بیست سال پیش به‌عنوان یکی از نخستین آزمایش‌های یادگیری ماشین در این شرکت آغاز شد و اکنون به مرحله‌ای رسیده که هر ماه بیش از یک تریلیون واژه برای میلیاردها کاربر در سراسر جهان ترجمه می‌شود. جمنای ۳.۵ لایو ترنسلیت گام بعدی این مسیر است که به‌زودی به ابزارهای توسعه‌دهندگان نیز خواهد رسید.