Stable Audio

Stable Audio – Stability AI 推出的 AI 音频生成平台，根据文字描述快速生成高质量音乐、音效与完整曲目。

功能名称	核心能力	技术原理
文本生成音乐	输入描述（如“舒缓的钢琴曲，带有弦乐，适合雨天”），生成对应风格的音乐	基于潜在扩散模型（Latent Diffusion）在压缩音频表示空间进行迭代去噪，生成符合文本语义的音频波形
文本生成音效	生成各类短音效（脚步声、开门声、城市交通等），支持时长和氛围调整	使用大规模音效数据集进行微调，模型学习文本标签与音频频谱的映射关系
音频变奏与扩展	对已生成的音频进行延长、变奏或风格迁移，保持内容一致性	通过自回归补全技术和语义保持模块，在潜在空间中延续音频序列
精细参数控制	可指定 BPM、调性、乐器组合，甚至使用负面提示词排除不想要的声音	模型引入条件控制机制，将用户参数编码为嵌入向量，引导生成过程

生成氛围感完整的背景音乐
- 步骤1：在提示词中详细描述场景（例如“温暖复古的爵士三重奏，钢琴、萨克斯和贝斯，柔和灯光下的咖啡馆氛围，中速，2分钟”）。
- 步骤2：设置“负面提示词”排除不需要的元素（如“不要鼓点，不要人声”）。
- 步骤3：点击生成，试听后下载。
- 小技巧：在提示词中加入参考艺术家或风格关键词（如“类似坂本龙一的风格”）可让结果更具辨识度。
快速制作游戏环境音效
- 步骤1：选择“音效”模式，输入文本“古老的森林，远处有狼嚎，风吹树叶沙沙声，偶尔有猫头鹰叫，持续30秒”。
- 步骤2：调整“氛围强度”滑块，让声音更幽深或更明亮。
- 步骤3：生成并导出为无损格式，直接导入游戏引擎。
- 小技巧：先生成一个较长的基础音轨，再用音频软件循环剪辑，可获得无缝环境音。
从歌词生成伴奏
- 步骤1：将歌词或主题词输入文本框（例如“失落的爱情，慢节奏，吉他主导”）。
- 步骤2：指定 BPM 为 70，选择“民谣”风格标签。
- 步骤3：生成后下载伴奏，配合人声录制。
- 小技巧：如果生成的伴奏过于复杂，可以增加负面提示词“减少乐器数量，仅保留吉他和人声和声”。