万音第一版不追求大而全,先把最关键的闭环跑通: AI 输出文本 → 调用灵音能力 → 生成语音结果 → 可播放 / 可发送 / 可集成。 这里可以这样理解:万音是整个项目,灵音是第一阶段发声能力,当前网站则负责把方向、Demo 和规划展示清楚。
文本转语音:把任意 AI 输出快速转成可用音频,作为第一层基础能力。
声音角色:支持不同 AI 绑定不同音色、风格和声音身份,形成多 Agent 发声系统。
渠道输出:支持网页播放、Bot 发送、工作流播报,逐步抽象成统一接口。