ElevenLabs是目前效果最自然的AI配音工具,其声音克隆和情感控制技术在业内领先。本文覆盖所有核心功能的使用方法。
核心功能一:文字转语音(TTS)
最基础的用法:粘贴文字,选择音色,生成语音。ElevenLabs内置数百个预设音色,按语言、性别、年龄、风格分类。
关键设置:
– Stability(稳定性):数值越高越字正腔圆但略显机械,越低越有表情感但可能不稳定。推荐0.5-0.7。
– Similarity(相似度):克隆声音时的准确度,建议0.75以上。
– Style(风格强度):0-1,越高越夸张,新闻播报用0,情感类内容用0.5+。
核心功能二:声音克隆(Voice Cloning)
上传1-3分钟的清晰人声录音,ElevenLabs可以生成高度相似的数字声音。
录音要求:安静环境、无背景音乐、说话自然、录音质量清晰(手机录音即可)。录音内容不限,覆盖多种语调(正常说话、疑问句、感叹句)效果更好。
使用场景:有声书制作(保持一致的声音风格)、短视频批量配音、企业培训视频(使用真人声音但节省录音时间)。
核心功能三:多语言配音(Dubbing)
上传视频,ElevenLabs自动将其配音翻译成其他语言,并保留原始说话人的声音特征。目前支持中文、英文、日文、西班牙文等29种语言。
这个功能对出海内容创作者价值极大——一个中文视频直接生成英文/日文版本,声音还和原创者相似。
价格与商用说明
– 免费版:每月1万字符(约12分钟语音)
– Starter(5美元/月):3万字符,可商用
– Creator(22美元/月):10万字符,声音克隆,适合内容创作者
– Pro(99美元/月):50万字符,适合商业应用
重要:声音克隆他人的声音未经授权是违法行为。ElevenLabs要求声音克隆只能用于授权的声音(包括你自己的)。商用配音建议使用平台内置音色或自己的克隆声音。
