9月20日,ElevenLabs 宣布重大更新:Projects正式上线,为长音频创作者们带来了一项革命性的工具。这一工作流整合了语音合成、VoiceLab和Voice Library等功能,为长音频内容创作提供了前所未有的便捷体验。
【长音频创作的新纪元】
曾经,长音频创作者们面临着许多挑战,包括稳定性问题、工作流中的中断、不同演讲者之间声音不连贯的问题等。同时,将不同演讲者的文本片段拼接在一起时,声音过渡不流畅,创作连贯对话变得相当困难。即使只有一个小片段存在问题,也需要重新生成整个音频片段,这无疑效率低下。此外,特定文本文件格式需要在平台内使用之前进行转换,这也给用户带来了不便。
【一键生成全书】
但是,现在,Projects改变了一切。只需轻轻点击一个按钮,您就能够在几分钟内生成整本有声书。您可以将特定文本片段分配给不同的演讲者,从而保持了上下文的连贯性。同时,您还可以根据需要调整文本片段之间的暂停长度,以实现更精细的节奏掌控。此外,Projects还引入了选择性音频再生功能,您可以在不需要重新生成整个音频片段的情况下,重新生成较大文本片段的部分内容。这些片段将自动匹配周围音频的节奏和语调,确保了流畅过渡。最后,Projects现在支持导入.epub、.pdf和.txt文件,以及从URL初始化项目。
【快速入门】
使用Projects非常直观,简单几步即可开始创作:
- 从顶部菜单中选择Projects。
- 单击“创建新项目”。
- 选择初始化项目的方式。
- 开始编写您的文本。
- 单击“转换”以一次性渲染整个项目,或使用“播放和重新生成”来测试特定片段。
【主要功能】
Projects提供了类似Google Docs的用户友好界面,支持多种编辑功能:
- 一键转换:使用单个按钮一次性渲染整个项目,或使用“播放和重新生成”来测试特定片段。
- 演讲者分配:将不同文本片段分配给特定的演讲者,还可以为标题和段落选择默认声音。
- 重新生成音频片段:在大型音频片段中无缝重新生成特定部分,同时保持上下文的完整性。
- 插入暂停(即将推出):手动调整演讲段落之间的暂停长度(最多3秒),以精细掌控节奏。
- 按章划分:将文本分成章节,便于逐一处理特定片段。
- 保存和恢复进度:方便地暂停工作,然后从离开的地方继续。
- 导入文件:Projects支持导入.epub、.pdf和.txt文件,以及从URL初始化项目。
【全面兼容】
Projects与Speech Synthesis、VoiceLab和Voice Library并列,成为长音频合成的综合解决方案。此外,它与专业语音克隆、Voice Library以及多语言模型无缝集成。
- 专业语音克隆:生成您自己声音的长音频内容。您还可以通过Voice Library分享您的专业语音克隆,并在他人使用您的声音创建项目时获得角色奖励。
- Voice Library:从社区创建的众多声音中选择适合您叙述的完美声音。
- Eleven多语言:无论您选择预制声音、克隆声音还是自己的声音,都可以流畅地使用ElevenLabs多语言模型支持的所有语言。
【Projects正式上线】
通过Projects,ElevenLabs 的目标是设计一个尽可能简单的工具,使长音频生成变得简单。借鉴新的研究和用户反馈,开发了一个全面的解决方案,与现有的工具生态系统完美集成。
ElevenLabs的创始人表示:迫不及待地想听到创作者们用Projects为他们的故事赋予生命!
扫描以下二维码加群
告诉管理员您遇到的问题
我们会第一时间为您挑选优质教程和帮您解决问题