cosyvoice-speech-synthesizer

# 🎙️ CosyVoice 语音合成 - 让文字开口说话 > 想把一段文字变成语音？想听听广东话、四川话怎么说？想模仿老师的语气读课文？ > > 这个工具帮你一键搞定！ ## ✨ 它能做什么？ - 📖 **文字转语音** - 把文章、故事、通知变成真人般的语音 - 🗣️ **说各种方言** - 广东话、四川话、东北话、河南话...想听哪里的方言都行 - 😊 **带感情朗读** - 开心的、生气的、温柔的、严肃的，想怎么读就怎么读 - 🎭 **角色扮演** - 像老师讲课、像播音员播报、像小朋友说话 - 🎵 **调整声音** - 语速快慢、音调高低、音量大小，随心调节 ## 🚀 快速上手 ### 第一步：设置密钥（只需一次） ```bash export DASHSCOPE_API_KEY="你的阿里云 API 密钥" ``` ### 第二步：开始合成！你可以直接说："合成今天天气怎么样？", 或者 "用河南话说：这碗面真香！" 也可以用代码调用： ```bash # 最简单的用法 - 直接输入文字 python ~/.qoderwork/skills/cosyvoice-speech-sythesizer/scripts/synthesize.py \ --text "你好，世界！" \ --output hello.wav ``` ## 💡 实用场景示例 ### 场景 1：听听各地方言 ```bash # 用广东话说 python synthesize.py --text "使用广东话合成：我想吃干炒牛河" --output cantonese.wav # 用四川话说 python synthesize.py --text "用四川话说：这道菜太巴适了" --output sichuan.wav # 用河南话说 python synthesize.py --text "用河南话说：这碗面忒香了" --output henan.wav # 用东北话说 python synthesize.py --text "东北话版本：这旮旯真不错" --output dongbei.wav ``` ### 场景 2：给视频配音 ```bash # 热情活泼的宣传语 python synthesize.py \ --text "开心地：欢迎光临我们的新店，全场八折优惠！" \ --output promotion.wav # 正式庄重的通知 python synthesize.py \ --text "严肃地：请各位同学注意，明天上午九点开会" \ --output announcement.wav # 温柔亲切的睡前故事 python synthesize.py \ --text "温柔地：从前有一只小兔子，它最喜欢在森林里散步..." \ --output story.wav ``` ### 场景 3：模仿不同角色 ```bash # 像老师一样讲课 python synthesize.py \ --text "像老师一样：同学们，今天我们来学习光合作用" \ --output teacher.wav # 像新闻主播一样播报 python synthesize.py \ --text "像播音员一样：据本台记者报道，今日天气晴朗" \ --output news.wav # 像小朋友一样说话 python synthesize.py \ --text "像小孩一样：妈妈，我想吃冰淇淋！" \ --output child.wav ``` ### 场景 4：调整声音效果 ```bash # 放慢语速，适合学习跟读 python synthesize.py \ --text "慢速朗读：春眠不觉晓，处处闻啼鸟" \ --rate 0.8 \ --output slow.wav # 加快语速，适合快速浏览 python synthesize.py \ --text "快速播报：今日股市大涨，投资者信心倍增" \ --rate 1.3 \ --output fast.wav # 调大音量 python synthesize.py \ --text "大声说：重要通知！" \ --volume 80 \ --output loud.wav ``` ## 🎯 智能理解你的意思这个工具很聪明，能听懂你的自然语言描述，自动转换成专业的语音指令： | 你说的话 | 工具自动理解 | |---------|------------| | "用广东话合成..." | 自动加上广东话发音 | | "开心地说..." | 自动用开心的语气 | | "像老师一样..." | 自动模仿老师的口吻 | | "严肃地表达..." | 自动用严肃的语气 | **不需要记复杂的参数，像说话一样告诉它就行！** ## 🎵 可选音色 - `longanhuan`（默认）- 龙安欢，温柔女声 - `longanyang` - 龙安洋，沉稳男声 - `longhuhu_v3` - 龙呼呼，天真烂漫女童声更多音色请参考阿里云百炼[官方文档](https://help.aliyun.com/zh/model-studio/cosyvoice-voice-list) ## 📋 常用参数速查 | 参数 | 作用 | 示例 | |------|------|------| | `--text` | 要合成的文字 | `"你好"` | | `--output` | 输出文件名 | `output.wav` | | `--rate` | 语速（0.5慢，2.0快） | `1.2` | | `--volume` | 音量（0-100） | `80` | | `--voice` | 换不同的声音 | `longanyang` | ## 🗣️ 支持的方言和情感 **方言**：广东话、四川话、东北话、上海话、北京话、湖南话、湖北话、河南话、山东话、陕西话、台湾话 **情感**：开心、生气、温柔、悲伤、严肃、幽默、亲切、紧张、兴奋、平静、撒娇、威严 **角色**：老师、播音员、小孩、老人、客服、领导、朋友、医生、律师、销售、导游、新闻主播、诗人 > ⚠️ 注意：方言、情感和角色功能需要特定音色支持，不是所有音色都能用。 ## ❓ 常见问题 **Q: 为什么我的账号提示不支持 HTTP 调用？** A: 该 API 可能正在逐步开放中，请联系阿里云百炼客服确认你的账号权限。 **Q: 合成的音频能直接用吗？** A: 可以！生成的音频是标准 WAV/MP3 格式，可以直接用于视频、播客、通知等场景。 **Q: 音频链接多久有效？** A: 24 小时，建议及时下载保存。 **Q: 所有音色都支持方言和情感吗？** A: 不是，只有部分音色（特别是复刻音色）支持完整的方言和情感控制。 --- **现在就开始，让你的文字开口说话吧！** 🎉

cosyvoice-speech-synthesizer

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载 Zip 包

cosyvoice-speech-synthesizer