🔊 给 AI 提供发声能力的能力层

先做成 skill，再长成平台

万音第一版不追求大而全，先把最关键的闭环跑通： AI 输出文本 → 调用灵音能力 → 生成语音结果 → 可播放 / 可发送 / 可集成。 这里可以这样理解：万音是整个项目，灵音是第一阶段发声能力，当前网站则负责把方向、Demo 和规划展示清楚。

能力 01

文本转语音：把任意 AI 输出快速转成可用音频，作为第一层基础能力。

声音角色：支持不同 AI 绑定不同音色、风格和声音身份，形成多 Agent 发声系统。

渠道输出：支持网页播放、Bot 发送、工作流播报，逐步抽象成统一接口。

Step 1：定第一版输入输出 明确文本来源、声音模板、音频输出格式和回传方式，先收口，不做发散功能。

Step 2：打通最小闭环 先实现“AI 回复 → 语音生成 → 页面播放 / 消息发送”，证明能力层真的能跑起来。

Step 3：向 Skill / API 抽象 把页面能力抽成可复用接口，让别的 AI、Bot、workflow 也能直接调用。

当前功能页已切换为万音第一版规划页，后续可继续接入真实 demo 与 API 文档。