AI·新世界

首页
AI资讯
AI科普
AI新品
最新研究
导航

搜索

DeepL推出语音翻译服务：DeepL Voice

2024年11月13日

/

文章目录[隐藏]

主要功能
- 1. 支持的语言
- 2. 实时翻译
应用场景
- 1. 视频会议
- 2. 服务行业
技术优势
- 1. 实时性能
- 2. 自主开发
数据保护
- 数据传输
未来展望
- 1. 更多语音产品
- 2. 功能扩展

DeepL是一家以其在线文本翻译服务而闻名的德国初创公司，以其翻译的微妙和精确性著称，估值已达20亿美元，并拥有超过10万名付费客户。随着AI服务的持续增长，DeepL在其平台上增加了一种新的模式：音频。用户现在可以使用DeepL Voice来听某人用一种语言说话，并实时自动将其翻译成另一种语言。

地址：https://www.deepl.com/zh/products/voice

主要功能

1. 支持的语言

输入语言：DeepL Voice目前可以“听懂”英语、德语、日语、韩语、瑞典语、荷兰语、法语、土耳其语、波兰语、葡萄牙语、俄语、西班牙语和意大利语。
输出语言：翻译字幕可用于DeepL翻译器目前支持的所有33种语言。

2. 实时翻译

现场对话：DeepL Voice旨在实时、现场对话和视频会议中使用，以文本形式呈现翻译结果，而非音频。
显示方式：用户可以设置翻译在智能手机上以“镜像”形式显示，将手机放在会议桌中间，以便双方都能看到翻译的文字，或者作为与某人并排共享的转录文本。
视频会议：视频会议服务将翻译显示为字幕。

应用场景

1. 视频会议

Teams集成：目前唯一支持DeepL字幕的视频通话服务是Microsoft Teams。DeepL的创始人兼CEO Jarek Kutylowski表示，这“覆盖了大多数客户”。
其他平台：关于Zoom或Google Meet是否会整合DeepL Voice，目前尚无消息。

2. 服务行业

前线工作人员：DeepL Voice的一个主要用例是在服务行业，例如餐厅的前线工作人员可以使用该服务更轻松地与顾客沟通。

技术优势

1. 实时性能

低延迟：DeepL Voice的独特卖点之一是其低延迟的实时翻译能力，这在市场上许多“AI翻译”服务存在延迟的情况下显得尤为重要。

2. 自主开发

从零开始构建：与许多依赖并调整其他公司大型语言模型（LLMs）的AI应用不同，DeepL的目标是从零开始构建其服务。今年7月，公司发布了一款针对翻译优化的全新LLM，声称其性能优于GPT-4以及谷歌和微软的模型。

数据保护

数据传输

服务器处理：语音数据将被传输到DeepL的服务器进行翻译，处理不在设备上进行。
隐私保护：Kutylowski坚称，系统不会保留任何内容，也不会用于训练其LLMs。公司还将与客户合作，确保他们不违反GDPR或其他数据保护法规。

未来展望

1. 更多语音产品

语音是未来：Kutylowski表示，语音是未来一年翻译将发挥作用的地方，暗示DeepL的首款语音产品DeepL Voice可能只是第一步，未来可能会有更多的语音相关产品推出。

2. 功能扩展

音频和视频输出：尽管目前DeepL Voice仅提供文本翻译，但Kutylowski暗示未来可能会增加音频和视频输出功能。
API和集成：目前还没有针对语音产品的API，但DeepL正在直接与合作伙伴和客户合作，未来可能会提供更多集成选项。

相关文章

Hugging Face 发布 Moonshine Web：基于浏览器的本地实时语音识别，注重隐私
Hume AI 推出一款旨在平衡语言准确性与情感理解的语音语言模型OCTAVE
Hume AI 推出“Voice Control”：无需编码即可定制AI语音
英伟达发布了一个拥有25亿参数的音频模型Fugatto：能够从文本和音频输入生成音乐、声音和人声
ElevenLabs推出对话式AI机器人构建功能，强化文本转语音服务

上一篇：英伟达推出多任务生成性纠错大语言模型NEKO：专门针对语音识别、机器翻译、OCR等领域的后处理错误纠正任务

下一篇： AI搜索引擎Perplexity宣布将从本周开始在其平台上进行广告实验

Copyright 2024 | 版权所有：AI·新世界| 皖ICP备18025588号-3 | 网站托管于：腾讯云