我前天写了海螺视频Agent:真有手就行!海螺视频Agent,爆款AI视频一键生成
MiniMax在前四天都交出了让人满意的答卷。
第一天:开源了MiniMax首个推理模型M1
第二天:发布海螺2.0视频模型
第三天:上线了AI超级智能体MiniMax Agent
第四天:上线了Hailuo Video Agent
最后一天,MiniMax上线了Speech 02,一个可以提供任意语言 × 任意口音 × 任意音色的AI声音模型。

先说一下MiniMax Speech 02有多强。
在两个基准(Artificial Analysis Speech Arena、Hugging Face TTS Arena)上,Speech 02均拿下了全球第一。

目前MiniMax 语音有四个主要功能:语音合成、音乐创作、音色设计、人声提取。
一、语音合成
这个功能葉子之前介绍了很多次,基本是AI配音的T1级别。

直接输入文本,然后选择内置的音色或者克隆的音色就可以生成配音。
目前长文本支持一次生成20万字符。
可以一次配音完一整部短篇小说了。
二、音乐创作
音乐创作和其他的AI音乐工具差不多,分为简单模式和高级模式。
区别就是简单模式,是输入一句想法然后由AI自动生成。
高级模式可以输入自定义的歌词,然后选择想要的风格、情绪、场景等。

三、音色设计
这个是今天重要要分享的功能。

即随意定制任意语言、任意口音、任意音色。
理论上来说:它能够生成任何音色。
我们只需要提供角色的概念就可以。
比如:一个日本的歌姬,声音是御姐音,优雅有磁性
让AI自动生成一个文本,听一听效果:

再比如:一个AI人工智能,年轻的女性声音,没有任何感情的电子合成音
再来一个:中国古代男性,书生意气
可以这么说。
MiniMax Speech 02就是一个可以随心定制的AI声音生成器。
我们可以随心的根据自己的需求去定制个性化的音色。
特别是对于我们这些制作AI视频的创作者而言。
我们每个视频都会涉及到不同的角色,需要不同的声音。
以往我们需要找不同的配音演员,或者找不同的人去做声音的克隆。
现在只需要把人物的人设输入,就可以诞生一个独一无二的声音,给我们的AI视频增色。
四、人声提取
这个功能之前就有,主要是为了做声音克隆时使用。
我们可以录制任意一段声音,或者剪辑任意一段音频。
然后通过人声提取,提取出干净的人声,用来进行声音克隆。
五、价格便宜
除了上面四个主要的功能。
MINIMAX 语音的价格说实话真的是白菜价。
只免费用户,每月赠送10000声贝包(约能生成12分钟的音频)。
基本已经满足了绝大多数个人创作者的需求了。
有更多需求的才需要充值会员。而且价格也不贵。
写在最后
AI工具的不断创新,让我们拥有了越来越多的创作自由。
就像今天给大家分享了MiniMax Speech 02,让AI视频的创作又向前走了一步。
但我们应该用这些更好的AI工具去创作更优质的作品,而不是一味追求流量。
就像MiniMax这样,默默沉淀许久,给大家切实的带来最好用的模型产品。
切实的诠释了,什么是中国的AI交付级产品。
暂无评论内容