在 2025 年 Google I/O 大会上宣布的一项开创性举措中,Google 正在通过在 Google Meet 中引入实时语音翻译来改变全球通信。这项强大的新功能使用了 Google DeepMind 的高级大型语言音频模型,旨在使不同语言的对话感觉自然而轻松。
该功能的工作原理是将口语实时翻译成听众的首选语言,同时保持原始语音、语气和表情不变。这意味着对话听起来仍然很人情味和情感化,而不是机器人或平淡无奇。
根据 Google 的说法,这项创新有许多实际用途。想象一下,说英语的孙子孙女与讲西班牙语的祖父母顺利聊天,或者公司的国际团队无论说什么语言都能即时沟通。可能性是无穷无尽的。使此功能真正改变游戏规则的是其超低延迟。对话几乎是即时发生的,这使得跨语言的实时小组讨论不仅成为可能,而且流畅无缝,谷歌表示这“直到现在才成为可能”。
更令人印象深刻的是,当有人说话时,您仍然会隐约听到他们的原始声音,翻译后的语音叠加在上面,保留了说话者的真实性。
这款新的翻译工具将于周二开始向消费者 AI 订阅者推出测试版。最初,它将支持英语和西班牙语,在接下来的几周内将支持意大利语、德语和葡萄牙语。展望未来,Google 还将此功能扩展到商业领域。Workspace 客户将在今年晚些时候获得早期测试访问权限,因为该公司将继续改进该功能以供专业使用。
数字力公开课618大促活动进行中,全站SAAS系统优惠加码,点击图片了解活动详情:
更多AI前沿资讯、工具、实战,关注数字力公开课:
官方网站:www.addloo.com
视频号:数字力公开课
抖音号:数字力公开课
小程序:数字力公开课