گوگل تازهترین مدل هوش مصنوعی خود برای ترجمه گفتاری را معرفی کرد؛ «جمنای ۳.۵ لایو ترنسلیت» مدلی است که با پشتیبانی از بیش از ۷۰ زبان، ترجمه زنده و پیوسته مکالمه را به شکلی طبیعی و نزدیک به صدای گوینده اصلی ممکن میسازد. این مدل نهتنها محتوای کلامی، بلکه آهنگ، سرعت و زیروبم صدای گوینده را نیز در خروجی حفظ میکند.
تفاوت اصلی این فناوری با سیستمهای ترجمه سنتی در رویکرد پردازش آن است؛ در حالی که مدلهای پیشین منتظر میماندند تا گوینده جملهاش را کامل کند، جمنای ۳.۵ لایو ترنسلیت گفتار را همزمان با بیان پردازش میکند و تنها چند ثانیه از گوینده عقب میماند. نتیجه این رویکرد، تجربهای روان و بدون مکثهای ناخوشایند است که حس گفتوگوی طبیعی را حفظ میکند.
این قابلیت از هماکنون در اپلیکیشن گوگل ترنسلیت برای اندروید و iOS در حال انتشار است. کافی است هنگام اتصال هدفون، گزینه «ترجمه زنده» را در گوشه پایینچپ صفحه لمس کنید. در کنار این، نسخه اندروید اپلیکیشن از حالت جدیدی به نام «حالت شنیدن» بهرهمند شده که کاربر بدون نیاز به هدفون، با گرفتن گوشی کنار گوش خود میتواند ترجمه را از طریق اسپیکر دنبال کند.
گوگل اعلام کرده که این مدل به گوگل میت نیز راه پیدا خواهد کرد؛ سرویسی که پیشتر ترجمه گفتاری را تنها از پنج زبان پشتیبانی میکرد و محدود به خروجی انگلیسی بود. با این بهروزرسانی، بیش از ۲۰۰۰ ترکیب زبانی در یک جلسه واحد پشتیبانی میشود. نسخه وب گوگل میت نیز از همین ماه بهصورت آزمایشی دکمهای اختصاصی برای فعالسازی سریع ترجمه گفتار دریافت خواهد کرد.
از نظر فنی، این مدل بدون تنظیم دستی از ورودیهای چندزبانه پشتیبانی میکند و در محیطهای پر سروصدا نیز عملکرد پایداری دارد. کاربردهای آن طیف گستردهای از تماسهای چندزبانه و جلسات کاری تا کلاسهای درس و پخشهای زنده را در بر میگیرد.
در حوزه ایمنی، گوگل تأکید کرده که تمام خروجیهای صوتی تولیدشده توسط این مدل با فناوری «سینتآیدی» واترمارکگذاری میشوند؛ نشانهای نامرئی که مستقیماً در فایل صوتی تعبیه میشود تا محتوای ساختهشده با هوش مصنوعی قابل ردیابی باشد و از انتشار اطلاعات نادرست جلوگیری کند. این اقدام بخشی از رویکرد کلی گوگل برای شفافیت در استفاده از هوش مصنوعی مولد است.
گوگل یادآور شده که ترجمه از بیست سال پیش بهعنوان یکی از نخستین آزمایشهای یادگیری ماشین در این شرکت آغاز شد و اکنون به مرحلهای رسیده که هر ماه بیش از یک تریلیون واژه برای میلیاردها کاربر در سراسر جهان ترجمه میشود. جمنای ۳.۵ لایو ترنسلیت گام بعدی این مسیر است که بهزودی به ابزارهای توسعهدهندگان نیز خواهد رسید.







