happy-tts

生产力

这个 Skill 提供 MiniMax TTS API 的完整封装,支持文本转语音、声音克隆和声音设计功能。

热度1047Star315Update2026-01-25
暂无实践

SKILL.md

前往 Source
namedescription
tts-skillMiniMax TTS API - 文本转语音、声音克隆、声音设计

MiniMax TTS Skill

这个 Skill 提供 MiniMax TTS API 的完整封装,支持文本转语音、声音克隆和声音设计功能。

快速开始

1. 环境配置

确保已设置环境变量:

export MINIMAX_API_KEY="your-api-key"

详细配置说明见 setup.md

2. 使用 Python 模块

import sys
import os

# 获取 skill 目录路径
skill_dir = os.path.dirname(os.path.abspath(__file__))
sys.path.insert(0, os.path.join(skill_dir, "assets"))

from minimax_tts import text_to_audio, list_voices, voice_clone, voice_design, play_audio

功能概览

功能函数说明
文本转语音text_to_audio()将文本转换为语音文件
列出声音list_voices()获取可用的声音列表
声音克隆voice_clone()基于音频文件克隆声音
声音设计voice_design()根据文字描述生成声音
播放音频play_audio()播放音频文件

详细文档

快速示例

文本转语音

text_to_audio(
    text="你好,欢迎使用 MiniMax TTS 服务!",
    voice_id="female-shaonv",
    output_path="./hello.mp3"
)

列出可用声音

voices = list_voices(voice_type="system")
for voice in voices:
    print(f"{voice['voice_id']}: {voice['name']}")

声音克隆

voice_clone(
    voice_id="my-custom-voice",
    audio_file="./sample.mp3",
    voice_name="我的声音"
)

声音设计

voice_design(
    prompt="一个温柔的年轻女性声音,带有轻微的南方口音",
    preview_text="你好,这是我的声音"
)

支持的模型

模型说明
speech-02-hd高清版本,音质最佳
speech-02-turbo快速版本,延迟低
speech-01-hd旧版高清
speech-01-turbo旧版快速
speech-2.6-hd2.6 版高清
speech-2.6-turbo2.6 版快速

常用声音 ID

系统预设声音

  • female-shaonv - 少女音
  • female-yujie - 御姐音
  • female-chengshu - 成熟女声
  • male-qingnian - 青年男声
  • male-chengshu - 成熟男声

更多声音请使用 list_voices() 查询。

常见问题

happy-tts 是什么?
happy-tts 是一个 AI Agent Skill(智能体技能)。这个 Skill 提供 MiniMax TTS API 的完整封装,支持文本转语音、声音克隆和声音设计功能。
happy-tts 怎么用?
你可以在 Skill Hub 中国下载 happy-tts 的 SKILL.md 文件,放入你的项目目录中。AI Agent(如 Claude Code)会自动识别并加载该 Skill,按照其中定义的规则和流程来辅助你完成任务。目前已有 1 篇实践案例可供参考。
happy-tts 有哪些实践案例?
目前 Skill Hub 中国收录了 1 篇 happy-tts 的实践案例,涵盖真实项目中的使用场景、操作步骤和踩坑记录。你可以在本页面的「热门实践」区域查看完整列表。
happy-tts 和 browser-use 有什么区别?
happy-tts 和 browser-use 都属于「生产力」类别的 AI Skill。happy-tts 主要用于这个 Skill 提供 MiniMax TTS API 的完整封装,支持文本转语音、声音克隆和声音设计功能。。browser-use 则侧重于用于网页测试、表单填写、截图和数据提取的浏览器交互自动化工具。当用户需要浏览网站、与网页交互、填写表单、截图或从网页中提。你可以根据具体场景选择最合适的 Skill。