文章目录[隐藏]
DeepL是一家以其在线文本翻译服务而闻名的德国初创公司,以其翻译的微妙和精确性著称,估值已达20亿美元,并拥有超过10万名付费客户。随着AI服务的持续增长,DeepL在其平台上增加了一种新的模式:音频。用户现在可以使用DeepL Voice来听某人用一种语言说话,并实时自动将其翻译成另一种语言。
主要功能
1. 支持的语言
- 输入语言:DeepL Voice目前可以“听懂”英语、德语、日语、韩语、瑞典语、荷兰语、法语、土耳其语、波兰语、葡萄牙语、俄语、西班牙语和意大利语。
- 输出语言:翻译字幕可用于DeepL翻译器目前支持的所有33种语言。
2. 实时翻译
- 现场对话:DeepL Voice旨在实时、现场对话和视频会议中使用,以文本形式呈现翻译结果,而非音频。
- 显示方式:用户可以设置翻译在智能手机上以“镜像”形式显示,将手机放在会议桌中间,以便双方都能看到翻译的文字,或者作为与某人并排共享的转录文本。
- 视频会议:视频会议服务将翻译显示为字幕。
应用场景
1. 视频会议
- Teams集成:目前唯一支持DeepL字幕的视频通话服务是Microsoft Teams。DeepL的创始人兼CEO Jarek Kutylowski表示,这“覆盖了大多数客户”。
- 其他平台:关于Zoom或Google Meet是否会整合DeepL Voice,目前尚无消息。
2. 服务行业
- 前线工作人员:DeepL Voice的一个主要用例是在服务行业,例如餐厅的前线工作人员可以使用该服务更轻松地与顾客沟通。
技术优势
1. 实时性能
- 低延迟:DeepL Voice的独特卖点之一是其低延迟的实时翻译能力,这在市场上许多“AI翻译”服务存在延迟的情况下显得尤为重要。
2. 自主开发
- 从零开始构建:与许多依赖并调整其他公司大型语言模型(LLMs)的AI应用不同,DeepL的目标是从零开始构建其服务。今年7月,公司发布了一款针对翻译优化的全新LLM,声称其性能优于GPT-4以及谷歌和微软的模型。
数据保护
数据传输
- 服务器处理:语音数据将被传输到DeepL的服务器进行翻译,处理不在设备上进行。
- 隐私保护:Kutylowski坚称,系统不会保留任何内容,也不会用于训练其LLMs。公司还将与客户合作,确保他们不违反GDPR或其他数据保护法规。
未来展望
1. 更多语音产品
- 语音是未来:Kutylowski表示,语音是未来一年翻译将发挥作用的地方,暗示DeepL的首款语音产品DeepL Voice可能只是第一步,未来可能会有更多的语音相关产品推出。
2. 功能扩展
- 音频和视频输出:尽管目前DeepL Voice仅提供文本翻译,但Kutylowski暗示未来可能会增加音频和视频输出功能。
- API和集成:目前还没有针对语音产品的API,但DeepL正在直接与合作伙伴和客户合作,未来可能会提供更多集成选项。