ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

谷歌推实时耳机翻译功能,Gemini技术提升语言体验

2025-12-14

摘要

谷歌翻译推出由Gemini AI驱动的多项更新。核心功能是通过任意耳机实现的实时语音翻译,支持超过70种语言和2000个语言对,并能保留说话者的语气与节奏。该测试功能已在美国、墨西哥和印度的安卓平台上线,计划于2026年扩展至iOS。同时,Gemini能力也提升了文本翻译的自然度,能更好地处理俚语和习语。此外,语言学习工具扩展至近20个新国家,并新增了口语反馈和学习天数统计功能。

线索

谷歌此次更新将翻译、实时语音交互和语言学习功能深度整合,对现有语言学习应用(如多邻国)构成直接竞争威胁。通过在拥有庞大用户基础的翻译应用内嵌入学习工具,谷歌利用其生态优势,可能分流专用语言学习软件的用户和市场份额。投资机会在于关注谷歌AI应用落地带来的生态壁垒增强,以及其对垂直领域软件公司的颠覆性影响。风险点则在于,实时翻译的准确性和延迟仍是技术挑战,若用户体验不佳可能影响功能推广。此外,处理实时语音数据引发的隐私问题也可能成为潜在的监管风险。

正文

谷歌公司宣布为其翻译应用引入多项由Gemini AI驱动的新功能,涵盖实时语音翻译、文本翻译质量提升及语言学习工具扩展。

在实时语音翻译方面,谷歌推出了一项通过耳机实现的测试功能。用户佩戴任意品牌的耳机后,可在Android版Google Translate应用中开启“Live translate(实时翻译)”功能,选择目标语言,即可收听他人讲话的实时翻译音频。该功能旨在保留说话者原有的语气、重音和语速节奏,以帮助用户更易跟进对话并分辨不同说话人。此功能可将任意耳机转变为单向同声传译设备,适用于跨语言交流、聆听外语演讲或课程等场景。在双向对话模式下,用户可通过耳机收听翻译,同时手机会播报用户说话的翻译内容。该功能基于Gemini模型,支持超过70种语言和2000个语言对的语音翻译,并具备自动语言识别能力。目前,此测试功能已在美国、墨西哥和印度的Android平台推出,并计划在2026年扩展至iOS设备及更多国家和地区。与部分需要特定硬件的方案不同,谷歌的此功能对耳机品牌和类型没有限制。

在文本翻译方面,谷歌引入了更高级的Gemini能力,以提升翻译质量,使译文更加自然、贴近真实语境。借助Gemini,系统在处理俚语、成语、地方表达等具有语境依赖性的语句时,能够给出更符合实际含义的译文,而非机械化的逐词直译。例如,对于英文习语“stealing my thunder”,系统能结合上下文进行语义理解,输出更贴近母语使用者习惯的译法。此项增强功能正逐步在美国和印度上线,支持英语与近20种语言(包括西班牙语、阿拉伯语、中文、日语和德语等)之间的互译,用户可在Android、iOS及网页端使用。

在语言学习方面,谷歌扩展了其应用内的学习工具至近20个新国家,包括德国、印度、瑞典和台湾地区。新增的语言对支持英语使用者练习德语和葡萄牙语,同时支持使用孟加拉语、简体中文、荷兰语、德语、印地语、意大利语、罗马尼亚语和瑞典语的用户练习英语。学习工具还新增了更细致的反馈机制,在用户口语练习后提供针对性的改进建议,以帮助提升发音与表达准确度。此外,应用内加入了学习“连击天数”统计功能,用于记录用户连续学习天数,鼓励持续学习。

发布时间

2025-12-13 02:29:00

相关推荐

评论 ( 0 )

3.3 W

文章

59.5 W

点赞

回顶部