吉他谱介绍: 前几天,昆仑万维旗下的视频生成模型 SkyReels-V4,刚刚在 Artificial Analysis 的文生视频(带音频)榜单中拿下第一。
前几天,昆仑万维旗下的视频生成模型 SkyReels-V4,刚刚在 Artificial Analysis 的文生视频(带音频)榜单中拿下第一。
Artificial Analysis 在业界素有「AI 领域 Gartner」之称,是当前全球最具影响力的 AI 大模型独立评测机构之一。它的评测强调独立性,所有测试均由机构内部完成,不依赖 AI 实验室自行报告的数据,评测结果曾被 OpenAI、Anthropic、Google 等全球头部 AI 公司以及权威媒体认可和引用。
在这样的评测体系下拿到双榜第一,说明 Mureka V8 经过了最严苛的第三方检验。
当然,好看的榜单还需要真实体验来印证。接下来,我们还是老规矩,上手实测一番。
相比于之前版本,Mureka V8 最大的亮点是生成的音乐完全可以直接发行,人声更富情感,旋律也更有记忆点。
「简易」模式下,只需输入一段歌曲描述便能直接生成完整歌曲,还可上传参考音频,模型会在理解创作意图的基础上完成完整编曲、人声演唱和混音输出。
它支持中英文及多语种,段落结构、情绪推进、唱法选择均可通过提示词介入控制。
先来首硬核 Phonk,提示词给的是「有种喝了第 4 杯浓缩咖啡带来的亢奋」,听听看,是不是还没到一半就开始抖腿了?
或者输入「生成一首春日小曲」,其他啥也不用管,不到 30 秒,Mureka V8 直出两首轻松欢快的民谣。温柔的演唱配合柔和的编曲,让人听完就想出门晒太阳。
说唱风格也能 hold 住。我们输入提示词:中文说唱,男声,歌词关于城市里的漂泊与奋斗,节奏感强,带有嘻哈风格的 beat。
咱先不聊音乐性,看看这歌词写的:「红绿灯闪烁着这座城冷漠的频率,无数个灵魂在斑马线上交错浮沉,我抬头看那云端上高耸的起重机,正一点点吊起我那颗悬空的野心……这座城从不承诺谁会衣锦还乡,只在每一个深夜里审视你的顽强」,很有画面感和象征性的隐喻。
我们再来整个活,专门测一下 Mureka V8 的口条:生成一首高速中文流行说唱,女声主唱,歌词包含大量绕口令和密集辅音,比如「四是四,十是十」,要求咬字清晰、节奏贴合鼓点、情绪有推进。
如果懒得想提示词,我们还可以使用「投骰子」功能,让其随机生成。那主题就五花八门了,什么打字机有节奏的敲击声、油渍里的彩虹色、抓不到的那只嗡嗡叫蚊子、健身房里嗓门巨大的肌肉男,啥都能拿来做成音乐。
自定义模式就进阶一些,不仅可以选择风格九游娱乐和人声,还能直接输入歌词,把一首歌从情绪到表达完全掌控在自己手里。
前段时间,一首叫《菩萨鱼》的 AI 歌曲火遍全网,它之所以爆火,是因为 AI 用慵懒冷峻的旋律和充满反讽的哲思,唱出了人类在现实规训下的挣扎与无奈,那种反差感直击灵魂。
顺着这个思路,我们也来复刻一首。我们要用 AI 来唱一首「反抗 AI 与算法」的歌,主题是:科技没有让人更轻松,反而把我们变成了更精致的零件,让人越发焦虑。
Mureka V8 在 Artificial Analysis(AA)评测中,人声与乐器双榜单取得第一的成绩,是其底层技术架构长期演进的量变引起质变。在过往的 AI 音乐生成赛道中,行业普遍面临着旋律缺乏发展、编曲元素停滞不前、人声机械化以及听感扁平化等核心技术瓶颈。Mureka V8 与即将发布的 V9,正是针对这些真实创作痛点给出的系统性技术解法。
Mureka V8 的技术进步,标志着 AI 音乐从「实验性声音段落」的生成,向具备完整审美价值的「音乐作品」迈进。
在生成逻辑层面,V8 显著提升了音乐的结构完整性与动态发展能力。与以往简单循环片段的输出不同,V8 能够构建出清晰的主副歌对比、具有记忆点的旋律以及完整的段落结构。
在声学表现上,V8 在人声的表现和编曲层次上也进行了深度优化。通过精准匹配人声音色与唱法,模型能赋予虚拟演唱者更强的「主唱存在感」与情感张力。
此外,混音与声场构建技术的提升,让 V8 的配器更加饱满,混响比例与空间层次接近专业音乐制作水准,显著消除了早期 AI 音乐中的「粗糙感」与「干涩感」。
支撑 Mureka 核心模型持续进化的基础技术,是昆仑万维自研的MusiCoT(Music Chain-of-Thought)技术体系。自 2024 年初启动以来,研发团队逐步完成了评测、后训练与强化学习的技术闭环。
与传统依赖文本提示进行线性自回归生成、容易偏离人类创作模式的模型不同,MusiCoT 在技术链路上进行了创新重构。它引入了中间推理机制,使模型在生成具体的音频 token 之前,能够先自主「思考」并预定义整体的音乐结构、风格与乐器配置。同时,该体系底层依托 CLAP(对比语言-音频预训练)架构,在同一个表征空间内对文本与音频进行对齐训练。
这种深层次的协同建模能力,使模型在旋律推进、段落表达与音色安排之间建立了内在一致性。通过将复杂的音乐理论转化为模型可理解的推理链路,MusiCoT 成功地将主观的「好听」转化为了可高频复现的系统性能力,让 AI 具备了驾驭宏大音乐叙事的基础。
在 V8 打下的音质与乐感基础上,Mureka V9 将技术演进的重点放在了「创作意图的可控表达」上。如果说 V8 主要解决的是「质感」问题,V9 则致力于消除 AI 生成与创作者意图之间的「表达偏差」。
V9 进一步深化了 MusiCoT 的细粒度控制能力,优化了推理链路,显著提高了文本到音乐的处理效率与生成速度。在控制精度方面,V9 实现了对段落内文本的精准把控,能够准确理解歌词中的语义重心、情绪转折与演唱意图,从而确保歌词在对应的音乐段落中得到「恰如其分」的表达,同时有效减少了无意义的哼唱和模糊的唱词。
此外,V9 在生成结果的多样性与混音质量上持续优化,推动 AI 音乐技术从「高质感生成」向影视、游戏等全场景赋能的「精准定制」迈进。
3 月 27 日,Mureka V9 将在昆仑万维相关发布活动中正式亮相,届时其完整能力边界也将进一步揭晓。
早在 2024 年 2 月,昆仑万维就开始搞 AI 音乐大模型研发,不过彼时还在用一个叫 SkyMusic 的内测版本跑通最基础的训练、推理和评测闭环,目标也只是实现端到端「能用」。
2024 年 4 月,中英文版本上线天工,开始验证线 月做了首个超大规模版本,听感和音质有明显提升,独立产品也同步上线 月,多语种工程化落地,能力从双语变成多语种,可维护可迭代;2025 年,MusiCoT 和更系统化的评测、后训练、强化学习跑成闭环,模型进入有节奏、有方向的长期进化;2026 年 1 月,Mureka V8 正式发布,并在短短 2 个月登顶国际权威榜单。
技术归根结底是为表达服务,下次想写首歌记录生活,或者给自己的 Vlog 配个专属 BGM,不妨去官网亲自捏一首试试。
本站曲谱部分来源于网络,仅供学习交流分享,九游娱乐吉他教学网不承担任何由于内容的使用所引起的争议及损失。如有侵权,可联系管理员删除处理。本文链接:http://www.cznoblelift.com/news/5907.html


