openAI维基百科 openAI维基百科
  • 首页
  • 语言
    • LLaMA
    • ChatGPT
      • 基础教程
      • Prompt训练
      • API编程指南
      • ChatGPT拓展
    • 其它模型
  • 图像
    • 风格化
    • 画质增强
    • 图像识别
    • 视觉交互
    • 扩展填充
  • 绘画
    • Midjourney
    • Stable Diffusion
      • LoRA
      • ControlNet
      • Fooocus
      • ComfyUI
    • 其它模型
  • 音频
    • 人声模拟
    • 音频识别
    • 音频分离
    • 智能编曲
  • 视频
    • AI换脸
    • AI补帧
    • 视频抠图
    • 视频动漫化
    • 文本生成视频
  • 3D
    • 文本生成模型
  • 教程
    • 基础知识
    • 微软AI学习
    • 深度学习笔记
    • 交互式了解AI
  • 问答
  • 资源
首页 › 音频 › 人声模拟 › MockingBird|声音克隆

MockingBird|声音克隆

PhiltreX
3 年前⦁置顶

声音克隆

什么是MockingBird?

MockingBird在英文翻译中为:嘲鸫(美洲鸣禽,能模仿别种鸟的鸣叫);

顾名思义,该项目的主要功能就是可以模仿别人的声音。

MockingBird主要特点

  • 支持中文:支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等
  • Windows + Linux:可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)
  • 简单部署:仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder
  • 网络服务:可伺服你的训练结果,供远程调用。

Github地址

https://github.com/babysor/MockingBird

MockingBird数据集制作注意事项

  1. 尽量只有一个人声。
  2. 背景音乐尽量少。
  3. 人声的语调尽量平和。
  4. 人声尽量不要有口头语,并且说话内容大多是长句。
  5. 如果有多个发音人,要分别放在train目录下的不同子文件夹内。
  6. 尽量不要有汉字以外的字符,数字和英文尽量替换成同样读音的中文字符。
  7. 可以用拼音代替文字,制作数据集和运行软件时都可以使用这种方法。
    例如:数据集→shu4 ju4 ji2|七海→qi1 hai3|轻音对应的数字为5。
  8. 如初背景音乐的软件效果也比较有限,如果可以的话还是有先用纯语音。

部署教程

方式描述
MockingBird|便携版v1.1.7 – openAI免安装便携版本,解压即可使用,对亲手非常友好。
待完善手动配置搭建,推荐有电脑基础且爱折腾的用户使用。

MockingBird声音克隆
5
0
MockingBird|便携版v1.1.7
下一篇

评论 (0)

取消
    发表评论

猜你喜欢

  • VITS-fast-fine-tuning|声音克隆
  • Voice Changer|实时变音-WSL
  • Voice Changer|实时变音

论坛公告

为方便大家交流,交换资源等。

本站论坛限量开放注册中,免费答疑。

欢迎大家踊跃注册,关闭注册时间待定。

论坛地址:https://bbs.openai.wiki

增值服务

本站无广告|无会员|免注册

  1. 提供有偿远程帮助服务
  2. 提供POE会员代充代售
  3. 提供ChatGPT代充代售
  4. 提供Midjourney代充服务

商务合作

关于合作请点此联系

  • 首页
  • 语言
  • 图像
  • 绘画
  • 音频
  • 视频
  • 3D
  • 教程
  • 问答
  • 资源
Copyright © 20221212-2025 openAI维基百科. Designed by nicetheme. 京公网安备 11010502051430号 京ICP备2021019752号-5
  • 首页
  • 语言
    • LLaMA
    • ChatGPT
      • 基础教程
      • Prompt训练
      • API编程指南
      • ChatGPT拓展
    • 其它模型
  • 图像
    • 风格化
    • 画质增强
    • 图像识别
    • 视觉交互
    • 扩展填充
  • 绘画
    • Midjourney
    • Stable Diffusion
      • LoRA
      • ControlNet
      • Fooocus
      • ComfyUI
    • 其它模型
  • 音频
    • 人声模拟
    • 音频识别
    • 音频分离
    • 智能编曲
  • 视频
    • AI换脸
    • AI补帧
    • 视频抠图
    • 视频动漫化
    • 文本生成视频
  • 3D
    • 文本生成模型
  • 教程
    • 基础知识
    • 微软AI学习
    • 深度学习笔记
    • 交互式了解AI
  • 问答
  • 资源