欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

昔日王者Suno被超越,全球首個(gè)音樂推理大模型Mureka O1震撼發(fā)布

2025-03-27 11:58
來源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

作者|冰拿鐵

編輯|星奈

媒體|AI大模型工場

還記得去年全網(wǎng)刷屏的“謝帝謝帝我要Diss你”嗎?當(dāng)下,朋友說要寫歌懟你時(shí),別以為他們在過嘴癮——AI音樂大模型正讓每個(gè)嘴炮王者動(dòng)動(dòng)手指,即可秒變創(chuàng)作鬼才:

隨著AI重構(gòu)音樂創(chuàng)作生態(tài),樂理、和聲、編曲等專業(yè)鴻溝則正被技術(shù)填平,讓小白也能爆改“AI音樂家”,用音樂傳情達(dá)意,無論是“寫歌diss你”,還是深情款款的“想把我唱給你聽”,都能在AI加持下分分鐘實(shí)現(xiàn)?;诖耍珹I音樂也被AIGC行業(yè)視為極具潛力的落地場景,相關(guān)概念股的市場熱度持續(xù)水漲船高。

然而,這樣一個(gè)“大眾”賽道,布局者卻寥寥無幾,尤其是國內(nèi),存在巨大空白待填補(bǔ)。好在昆侖萬維等頭號(hào)玩家在產(chǎn)業(yè)爆發(fā)前夜,即敏銳預(yù)判到其潛力,并基于自身在AI、音樂等領(lǐng)域的深耕與積淀,搶先完成占位:

去年四月,昆侖萬維發(fā)布了第一代音樂生成模型Mureka V1(SkyMusic),并在此后一年持續(xù)打磨技術(shù),迭代升級,把“自己卷自己”演繹得淋漓盡致。

3月26日,昆侖萬維震撼發(fā)布全新基座模型:Mureka V6,并同步發(fā)布了全球首個(gè)采用 CoT 技術(shù)的音樂模型Mureka O1,在強(qiáng)大推理模型賦能下,Mureka O1會(huì)在音樂生成過程中加入思考與自我批判,顯著提升音樂品質(zhì)、音樂創(chuàng)作效率和靈活性。

而無論是Mureka V6還是O1模式,可支持的歌曲創(chuàng)作曲風(fēng)和情緒均涉及20余種,包括爵士/Jazz、電子/electronic、流行/pop、鄉(xiāng)村country等;情緒涵蓋快樂、放縱、神秘、充滿活力、悲傷等,能想到的風(fēng)格無所不包!

Mureka V6進(jìn)入界面

Mureka O1進(jìn)入界面

這讓行業(yè)感嘆,隨著“會(huì)思考的AI莫扎特”上線,過去AI音樂生成的“黑箱創(chuàng)作”、節(jié)奏斷層、風(fēng)格混亂、樂器編排打架等問題將大幅減少,音樂界終于迎來了自己的“DeepSeek時(shí)刻”。

與此同時(shí),《Mureka》AI音樂人MV全網(wǎng)首發(fā),給網(wǎng)友帶來一場春日視聽盛宴。

《Mureka》AI音樂人MV全網(wǎng)首發(fā),歌手:Mureka;該作品由AI生成,其中音樂由Mureka生成,視頻由SkyReels技術(shù)支持生成。

那么,“會(huì)思考的音樂家”表現(xiàn)如何?我們一起來看看吧!

一、零幀起手、多語言覆蓋、“氛圍感”BGM神器……“AI音樂家”Mureka強(qiáng)得可怕!

AI時(shí)代,不僅音樂無國界,音樂家也沒有門檻了!一番體驗(yàn)下來,最驚艷我的是,Mureka上手性強(qiáng)、極易操作,是“零幀起手”的端到端創(chuàng)作神器,支持歌詞、作曲、編曲、人聲全流程生成,音樂小白也可以將自身情感注入AI生成的框架中,通過簡單的流程生成滿意的作品,這將極大地拓展音樂創(chuàng)作者群體,讓普通人有機(jī)會(huì)參與到音樂創(chuàng)作中來,促進(jìn)音樂內(nèi)容的多樣化和個(gè)性化。

比如,動(dòng)動(dòng)手指,即可給朋友生成一首講述雙方友情的春日詩,暖她一整年~

當(dāng)開車上高速時(shí),也可以來一首“充滿自由氣息的仿佛在公路旅行的流行搖滾”,一鍵擁有獨(dú)屬自己的《Take Me Home, Country Roads》!

再輸入“在人來人往的城市里,置身于餐廳中悠閑的品嘗美食時(shí)播放的爵士歌曲”,就是這么Chill~

EMO時(shí),生成一首“深夜的酒吧在迷幻的燈光下黯然神傷聽到的靈魂歌曲”:

半夜失眠,輾轉(zhuǎn)反側(cè),思念已分手三年的前女友,這時(shí)不如化憂傷為音樂,把傷感釀成詩,一鍵生成“懷念曾經(jīng)的感情的傷感RB”:

同時(shí),輸入場景描述性Prompt,即可生成與特定場景完美契合的完整背景音樂。比如,選擇Mureka V6模型,選擇「純音樂」創(chuàng)作功能,在文本框內(nèi)輸入「Latin song」,點(diǎn)擊「創(chuàng)作」,Mureka快速為我們生成一首拉丁風(fēng)純音樂,仿佛置身于海灘,感受到熱情且愜意的度假氛圍。真·氛圍感神器!

而對于“提示詞詞窮”的零基礎(chǔ)小白,Mureka還貼心準(zhǔn)備了提示詞模板,如“一首悠閑浪漫的歌曲,講述與心上人的深夜對話”一首充滿力量的主題曲,強(qiáng)烈的嗓音和鼓舞人心的節(jié)拍”……化身用戶最強(qiáng)嘴替。

此前很多用戶自我調(diào)侃,自己用AI時(shí)像極了“說不明白訴求的甲方”。而Mureka預(yù)判了用戶的預(yù)判,激活用戶潛意識(shí)里的靈感,讓其直呼“對對對,我就是要這種感覺來著!”

同時(shí),Mureka還有歌曲參考(Reference Fuction)模式,即將音樂本身作為提示,用戶可直接上傳音頻或Youtube鏈接作為創(chuàng)作提示,讓Mureka“有樣學(xué)樣”,最快速度get用戶心水歌曲的精髓。

比如,以《知否知否》為參考,上傳古詩詞歌詞,讓AI把古詩詞《行香子》《漠漠春陰酒半酣》唱出來,結(jié)果可見,AI音樂感情充沛、旋律動(dòng)人,已跨越“可用性”門檻,進(jìn)入“高音質(zhì)”階段,突破了以往AI音樂局限于背景音或機(jī)械合成的瓶頸,使得AI音樂從輔助工具升級為創(chuàng)作伙伴,并不斷拓展藝術(shù)邊界,詩樂相和,讓古詩詞完成多樣藝術(shù)表達(dá)。

也可以玩梗,以《好運(yùn)來》為參考曲目,給自家張姐麻辣燙店定制店歌。感受下這歡快の小曲,張姐聽了瞬間喜笑顏開,立省大額推廣費(fèi):

當(dāng)然,在全球化時(shí)代,Mureka V6 還支持美歐亞主流10種語言(線上支持中英葡西日韓)的歌詞與音樂生成,涵蓋多種風(fēng)格與流派,滿足全球用戶需求。

如下,中文表現(xiàn)可圈可點(diǎn):

外語歌也不遜色,音色可控且保持一致性,不會(huì)讓聽眾“出戲”,在人聲音質(zhì)、自然度等維度,一如既往地維持業(yè)內(nèi)領(lǐng)先的SOTA水平

此外,Mureka還支持音軌分離下載,提供音樂生成的獨(dú)立的人聲、伴奏等多軌輸出,方便用戶后續(xù)混音與二次創(chuàng)作,讓音樂專業(yè)玩家狂喜,開啟“無限D(zhuǎn)IY”模式。

一番體驗(yàn)下來,流程簡單、風(fēng)格多樣的Mureka“人如其名”:據(jù)悉,Mureka名字的含義是Eureka flows music (尤里卡時(shí)刻),其中,Eureka源自希臘語的感嘆詞,意為我發(fā)現(xiàn)了,常用于表達(dá)靈感噴涌的時(shí)刻。

如今,Mureka加持下,每個(gè)創(chuàng)作者、音樂愛好者都能不斷迎接自己的“尤里卡時(shí)刻”,并在音樂靈感爆發(fā)時(shí)快速將其落地,并創(chuàng)作出屬于自己風(fēng)格的歌曲。

那么,讓用戶實(shí)現(xiàn)“音樂自由”背后,有著哪些硬核技術(shù)支撐?

二、極致體驗(yàn)背后:AI音樂的SOTA級玩家,帶來哪些技術(shù)顛覆?

在技術(shù)上,Mureka以先行者和領(lǐng)頭羊的姿態(tài)打出明牌。此前,業(yè)界關(guān)于音樂領(lǐng)域的算法工作非常少,只有少數(shù)幾個(gè)團(tuán)隊(duì)公開了自己的工作成果。而此次,Mureka團(tuán)隊(duì)以論文形式公開了Mureka O1的實(shí)現(xiàn)原理:

項(xiàng)目主頁:MusiCoT.github.io

具體而言,作為中國首個(gè)實(shí)現(xiàn)音樂AIGC SOTA的大模型,Mureka集成了在自然語言處理和音頻生成技術(shù)上的最新突破,使得AI音樂創(chuàng)作表現(xiàn)達(dá)到新高度:

其中,在Mureka V6中,引入自研 ICL(in-context learning)技術(shù),使得聲場更加開闊,人聲質(zhì)感和混音設(shè)計(jì)進(jìn)一步強(qiáng)化。當(dāng)然,重頭戲還在后面,即首次在音樂生成領(lǐng)域應(yīng)用先進(jìn)的Chain-of-Thought(CoT)技術(shù)的Mureka O1,讓AI音樂神器化身“會(huì)思考的AI莫扎特”:

Mureka O1 是基于 Mureka V6 之上的推理優(yōu)化版本,包含了Mureka團(tuán)隊(duì)最新發(fā)布的音樂生成領(lǐng)域的創(chuàng)新研究成果——MusiCoT,采取思維鏈Chain-of-Thought (CoT)方法。不同于傳統(tǒng)自回歸模型逐步生成音頻,MusiCoT首次在細(xì)粒度音頻token預(yù)測前預(yù)生成整體音樂結(jié)構(gòu),大幅提升生成音樂的結(jié)構(gòu)連貫性與樂器編排精準(zhǔn)度。

通俗地說,不會(huì)深度思考推理的AI音樂模型像沒有圖紙的施工隊(duì),直接開始砌磚頭,逐段生成音樂片段,容易導(dǎo)致副歌和主歌風(fēng)格不搭、鼓點(diǎn)突然消失等問題,就像房子蓋到一半發(fā)現(xiàn)廁所沒留水管。

思維鏈則爆改流程為“先通過縝密思考,畫個(gè)藍(lán)圖再施工”,規(guī)劃整首歌的“結(jié)構(gòu)藍(lán)圖”,比如前奏用鋼琴引入,主歌部分加入貝斯,副歌疊加弦樂和鼓,間奏來段吉他solo……相當(dāng)于先確定哪里是客廳、哪里是臥室,再基于架構(gòu)逐塊生成具體旋律。就像按圖紙精準(zhǔn)施工,確保每個(gè)樂器的出現(xiàn)時(shí)機(jī)、音量大小都嚴(yán)絲合縫,避免了傳統(tǒng)模型“打架子鼓時(shí)突然插進(jìn)嗩吶”的違和感,減少錯(cuò)拍、樂器沖突等車禍現(xiàn)場,特別適合需要精細(xì)控制結(jié)構(gòu)的商用創(chuàng)作,比如游戲配樂或影視OST。

如此一來,通過逐步反饋與優(yōu)化機(jī)制,Mureka顯著提升了歌詞旋律契合度、演唱準(zhǔn)確性和藝術(shù)表現(xiàn)力,同時(shí)保持了低延時(shí)音樂生成。

同時(shí),MusiCoT基于CLAP模型,無需人工標(biāo)注即具備高擴(kuò)展性,并顯著提高了生成音樂的可解釋性和質(zhì)量,讓AI進(jìn)化成“舉一反三的作曲小天才”。

如今,Mureka O1在與Suno V4等主流系統(tǒng)的客觀評測中表現(xiàn)卓越,不僅保持了低延遲音樂生成,還顯著提升了歌詞旋律契合度、演唱準(zhǔn)確性和藝術(shù)表現(xiàn)力,在發(fā)音唱對率、樂段準(zhǔn)確率、文本相關(guān)度、制作質(zhì)量等客觀指標(biāo)中,Mureka V6都顯著優(yōu)于Suno V4。

Mureka O1在文本生成音樂的客觀測評中得分(來源:Mureka官方測評)

當(dāng)然,音樂作為“靈魂按摩器”,最重要的還是聽感。在最新的音樂評測中,Mureka O1展現(xiàn)出卓越的音樂品質(zhì),在最終的整體聽感評測超過了Suno V4。其中,Mureka O1在樂器演奏法多樣性和配器設(shè)計(jì)方面明顯超越Suno V4,在音質(zhì)、人聲質(zhì)感及BGM質(zhì)感上也實(shí)現(xiàn)了顯著提升。

Mureka O1在主觀測評中展現(xiàn)出卓越的音樂品質(zhì),整體聽感評測超越Suno V4(來源:Mureka官方測評)

沒有實(shí)感?放一個(gè)Mureka O1與Suno V4的對比,自行感受“降維打擊”級音質(zhì):

悅耳無需多言!綜上所述,MusiCoT正為高保真AI音樂生成開辟全新路徑,推動(dòng)音樂AI創(chuàng)作邁入結(jié)構(gòu)化時(shí)代。

三、用戶價(jià)值、商業(yè)價(jià)值兩開花:以音樂為媒,構(gòu)建“數(shù)字巴別塔”!

值得一提的是,除了遙遙領(lǐng)先的音質(zhì)外,Mureka還是全球首個(gè)開放API服務(wù)的AI音樂生成平臺(tái)。秉承“期待AI音樂能在多種場景下創(chuàng)造更大的價(jià)值”的愿景,Mureka同時(shí)開放兩大類共計(jì)五種API服務(wù),不僅包括音樂音頻生成API(兩種),還有語音合成API(三種)。無論是開發(fā)者,還是音樂平臺(tái),都可以將Mureka的音樂生成能力無縫集成到自己的產(chǎn)品或平臺(tái)中,應(yīng)用AI音樂功能拓展自己的商業(yè)價(jià)值。

對于企業(yè)而言,Mureka可以輔助音樂、視頻、播客、廣告等場景中的UGC/PGC音樂創(chuàng)作,讓企業(yè)以極低的成本,用自己創(chuàng)作的版權(quán)音樂,訓(xùn)練屬于自己的音樂模型,用于發(fā)布會(huì)、宣傳MV等商業(yè)場景,降本增效;

而對于個(gè)人創(chuàng)作者來說,創(chuàng)造力將進(jìn)一步得到釋放。正如《AI紅利:創(chuàng)作者解鎖萬億市場》中指出,創(chuàng)意將是AI時(shí)代最好的生意,AI必將重塑創(chuàng)作者經(jīng)濟(jì),解鎖一個(gè)萬億規(guī)模的藍(lán)海市場——AI淘汰的是機(jī)器式創(chuàng)作,但會(huì)放大人類獨(dú)有的創(chuàng)造力:“未來最好的行業(yè)將是內(nèi)容行業(yè),那些具備思想深度、情感共鳴能力和文化洞察力的創(chuàng)作者,將借助AI工具釋放更大的創(chuàng)造力,成為新時(shí)代的贏家?!?/p>

這和昆侖萬維戰(zhàn)略思路不謀而合。昆侖萬維對音樂領(lǐng)域AIGC的探索,早在2021年就已經(jīng)開始。昆侖萬維董事長兼CEO方漢認(rèn)為,AI音樂生成技術(shù)的出現(xiàn),并不是為了“切走音樂行業(yè)的蛋糕”,而是使非專業(yè)人士也能輕松創(chuàng)作出具有一定水準(zhǔn)的音樂作品,提高行業(yè)整體的生產(chǎn)力和創(chuàng)新能力。

基于此,昆侖萬維喊出“All in AGI與AIGC”——早在2022年12月時(shí),昆侖萬維就正式發(fā)布了「昆侖天工」AIGC全系列算法與模型,并宣布模型開源,成為國內(nèi)第一個(gè)全身心投入到AIGC開源社區(qū)的公司。從音樂到視頻進(jìn)行大量研發(fā)投入,目的就是降低創(chuàng)作門檻,實(shí)現(xiàn)通用人工智能,讓每個(gè)人更好地塑造和表達(dá)自我。

這也符合行業(yè)發(fā)展的大勢所趨,即從“狂卷基礎(chǔ)模型”到“落地為王”。如今,以AI音樂為代表的AIGC勢不可擋,存在巨大產(chǎn)業(yè)藍(lán)海:在我國,《2024中國音樂產(chǎn)業(yè)發(fā)展總報(bào)告》顯示,2023年中國數(shù)字音樂產(chǎn)業(yè)規(guī)模達(dá)到893.45億元,中國網(wǎng)絡(luò)音樂用戶規(guī)模達(dá)到7.26億。政策層面,《“十四五”文化產(chǎn)業(yè)發(fā)展規(guī)劃》明確提出,推動(dòng)人工智能技術(shù)與文化創(chuàng)作、傳播、消費(fèi)深度融合,促進(jìn)文化產(chǎn)業(yè)的智能化轉(zhuǎn)型,釋放利好信號(hào);

放眼全球,根據(jù)Fortune Business Insights數(shù)據(jù),2023年全球數(shù)字音頻工作站(DAW, Digital Audio Workstation)市場規(guī)模高達(dá)約30億美元,預(yù)計(jì)2026年約70%的DAW企業(yè)將使用AI技術(shù)輔助音樂創(chuàng)作。

這也在Mureka的用戶群體中得到了驗(yàn)證,目前,有超過 100 個(gè)國家和地區(qū)的用戶用Mureka。值得一提的是,作為最早開拓海外市場的中國企業(yè)之一,昆侖萬維當(dāng)前業(yè)務(wù)已覆蓋全球一百多個(gè)國家和地區(qū),全球平均月活躍用戶近4億,覆蓋AGI與AIGC、信息分發(fā)、元宇宙、社交娛樂及游戲等多個(gè)領(lǐng)域,讓行業(yè)看到了昆侖萬維“以AIGC為媒,構(gòu)建數(shù)字巴別塔”的潛力:

在西方傳說中,人類在洪水之后試圖建造一座“通天塔”,然而,由于語言多樣性帶來的隔閡,人類由言語不通演變成相互起了沖突,最終“高聳入云的塔轟然倒塌”。

而如今,AI時(shí)代,新的“數(shù)字巴別塔”在人類精神平原上重新矗立——前有DeepSeek以開源促進(jìn)AI普惠浪潮涌動(dòng)、讓世界驚嘆“中國時(shí)刻”,后有昆侖萬維以前沿技術(shù)為槳,以音樂等世界通用語言為帆,“浮舟滄海,立馬昆侖”,探索AIGC應(yīng)用邊界。一言以蔽之,頭部企業(yè)正立足中國、揚(yáng)帆世界,駛向人類文明融合互鑒的新彼岸。

文中音頻試聽及視頻鏈接:https://mp.weixin.qq.com/s/mr0SyBi4TLbKYAaN0D9-DA

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請澎湃號(hào)請用電腦訪問http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司