我愿称之为最强！MiniMax Speech 02，随心定制任意语言、任意口音、任意音色-课多多

我前天写了海螺视频Agent：真有手就行！海螺视频Agent，爆款AI视频一键生成

MiniMax在前四天都交出了让人满意的答卷。

第一天：开源了MiniMax首个推理模型M1

第二天：发布海螺2.0视频模型

第三天：上线了AI超级智能体MiniMax Agent

第四天：上线了Hailuo Video Agent

最后一天，MiniMax上线了Speech 02，一个可以提供任意语言 × 任意口音 × 任意音色的AI声音模型。

先说一下MiniMax Speech 02有多强。

在两个基准（Artificial Analysis Speech Arena、Hugging Face TTS Arena）上，Speech 02均拿下了全球第一。

目前MiniMax 语音有四个主要功能：语音合成、音乐创作、音色设计、人声提取。

一、语音合成

这个功能葉子之前介绍了很多次，基本是AI配音的T1级别。

直接输入文本，然后选择内置的音色或者克隆的音色就可以生成配音。

目前长文本支持一次生成20万字符。

可以一次配音完一整部短篇小说了。

二、音乐创作

音乐创作和其他的AI音乐工具差不多，分为简单模式和高级模式。

区别就是简单模式，是输入一句想法然后由AI自动生成。

高级模式可以输入自定义的歌词，然后选择想要的风格、情绪、场景等。

三、音色设计

这个是今天重要要分享的功能。

即随意定制任意语言、任意口音、任意音色。

理论上来说：它能够生成任何音色。

我们只需要提供角色的概念就可以。

比如：一个日本的歌姬，声音是御姐音，优雅有磁性

让AI自动生成一个文本，听一听效果：

,9秒

再比如：一个AI人工智能，年轻的女性声音，没有任何感情的电子合成音

,5秒

再来一个：中国古代男性，书生意气

,11秒

可以这么说。

MiniMax Speech 02就是一个可以随心定制的AI声音生成器。

我们可以随心的根据自己的需求去定制个性化的音色。

特别是对于我们这些制作AI视频的创作者而言。

我们每个视频都会涉及到不同的角色，需要不同的声音。

以往我们需要找不同的配音演员，或者找不同的人去做声音的克隆。

现在只需要把人物的人设输入，就可以诞生一个独一无二的声音，给我们的AI视频增色。

四、人声提取

这个功能之前就有，主要是为了做声音克隆时使用。

我们可以录制任意一段声音，或者剪辑任意一段音频。

然后通过人声提取，提取出干净的人声，用来进行声音克隆。

五、价格便宜

除了上面四个主要的功能。

MINIMAX 语音的价格说实话真的是白菜价。

只免费用户，每月赠送10000声贝包(约能生成12分钟的音频)。

基本已经满足了绝大多数个人创作者的需求了。

有更多需求的才需要充值会员。而且价格也不贵。

写在最后

AI工具的不断创新，让我们拥有了越来越多的创作自由。

就像今天给大家分享了MiniMax Speech 02，让AI视频的创作又向前走了一步。

但我们应该用这些更好的AI工具去创作更优质的作品，而不是一味追求流量。

就像MiniMax这样，默默沉淀许久，给大家切实的带来最好用的模型产品。

切实的诠释了，什么是中国的AI交付级产品。

文章版权归作者所有，未经允许请勿转载。

THE END

AI笔记