欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

Kimi探索版首發(fā)體驗(yàn):秒搜310個(gè)網(wǎng)頁(yè),槍口瞄準(zhǔn)了百度?

2024-10-12 11:24
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

作為國(guó)內(nèi)最知名的 AI 智能助手之一,Kimi 早就成了包括小雷在內(nèi)很多人的「心頭好」。但在此之上,月之暗面今天(10 月 11 日)又推出了 Kimi 探索版,按照官方的介紹:

Kimi 探索版可以自主海量搜索解決復(fù)雜問(wèn)題。

事實(shí)上,之前就有爆料指出 Kimi 團(tuán)隊(duì)在國(guó)慶期間瘋狂趕進(jìn)度,就是為了即將上線一個(gè)「很牛的功能」。根據(jù)透露,這個(gè)功能可以回答簡(jiǎn)單搜索無(wú)法解決的問(wèn)題,甚至可以自我反思。

現(xiàn)在來(lái)看,那個(gè)「很牛的功能」就是剛剛發(fā)布的 Kimi 探索版。不僅如此,現(xiàn)在我們還知道,Kimi 探索版可以「模擬人類的推理思考過(guò)程,多級(jí)分解復(fù)雜問(wèn)題,執(zhí)行深度搜索,并即時(shí)反思改進(jìn)結(jié)果,」在一定程度上具備了 AI 自主搜索能力。

圖/ Kimi

經(jīng)常關(guān)注大模型的朋友,可能很快就會(huì)想到 OpenAI 在上月發(fā)布的 o1 模型,都是模擬和學(xué)習(xí)人類的推理思考過(guò)程,并且拆解復(fù)雜問(wèn)題、反思和改進(jìn)結(jié)果。但實(shí)際上,Kimi 探索版的體驗(yàn)又如何?

Kimi 探索版突破:會(huì)拆解任務(wù)了

正所謂「不看廣告看療效」,盡管官方表示 Kimi 探索版能夠提供更全面和準(zhǔn)確的答案,幫助用戶更高效地完成分析調(diào)研等復(fù)雜任務(wù),但 Kimi 探索版到底好不好用,還是只有用了才知道。

按照官方提供的信息,Kimi 探索版已逐步分批上線 Web 端,內(nèi)測(cè)過(guò)程中用戶每天能用 5 次,移動(dòng)端 APP 則將在后續(xù)上線該功能。不過(guò)有幸,小雷的 Kimi 已經(jīng)推送到了這個(gè)最新功能,可以在首頁(yè)輸入框下方直接開(kāi)打。

圖/雷科技

打開(kāi)「探索版」后,就會(huì)彈出提醒告訴我,「Kimi 會(huì)拆解復(fù)雜問(wèn)題,做更深入的搜索?!贡热?CS 本科學(xué)生可能非常關(guān)心的專碩申請(qǐng)情況,可以讓 Kimi 探索版「分析一下 2024 年 QS 排名前 10 的高校計(jì)算機(jī)專業(yè)碩士申請(qǐng)情況」。

先不論生成的回答,首先我們能看到一個(gè)非常明顯的變化,Kimi 探索版把任務(wù)大體拆解成了兩步:一是搜索 2024 年 QS 排名前 10 的高校;二是分別搜索了解各家高校計(jì)算機(jī)專業(yè)的碩士申請(qǐng)情況。

圖/雷科技

Kimi 探索版就像一個(gè)有條理的分析師一樣,基于大模型的能力識(shí)別用戶的真實(shí)提問(wèn)意圖,并把復(fù)雜的問(wèn)題分解為多個(gè)層次化的子問(wèn)題和多個(gè)匹配的搜索關(guān)鍵詞,然后分步驟執(zhí)行。

不只是簡(jiǎn)單的「給你結(jié)果」,而是幫你「分析問(wèn)題、找出答案」。

如果是常規(guī)的 AI 智能助手或 AI 搜索,面對(duì)類似的復(fù)雜問(wèn)題,通常也只是將問(wèn)題提煉成一組關(guān)鍵詞進(jìn)行搜索。如果能夠搜索到現(xiàn)成的文章和數(shù)據(jù),或許可以給出有價(jià)值的回答;但如果沒(méi)有,AI 給出的答案可能表面上看著豐富,但實(shí)際信息密度很低,準(zhǔn)確性也很難保證。

所以很多時(shí)候,很多問(wèn)題,我們還是只能回到傳統(tǒng)的搜索引擎,一步一步找。

與之相對(duì)的是,Kimi 探索版的多級(jí)分解與策略規(guī)劃功能,通過(guò)模擬人類的思考過(guò)程,一定程度正在改變這種局面。在給出的回答中,不僅準(zhǔn)確給出了 QS 前 10 的高校名單,還有比較明確的申請(qǐng)要求。

圖/雷科技

10 個(gè)網(wǎng)頁(yè)不夠用,那就搜索500 個(gè)

眾所周知,數(shù)據(jù)對(duì)于 AI 輸出結(jié)果有著很強(qiáng)的影響,這既體現(xiàn)在模型訓(xùn)練的過(guò)程中,但同時(shí)也體現(xiàn)在模型推理的過(guò)程中。

事實(shí)上,包括 Kimi 在內(nèi),不管是支持聯(lián)網(wǎng)搜索的 AI 智能助手,還是獨(dú)立的 AI 搜索引擎,RAG(檢索增強(qiáng)生成)技術(shù)都是事實(shí)上的標(biāo)配。通過(guò) RAG,大模型能夠利用強(qiáng)大的搜索算法查詢網(wǎng)頁(yè)等外部數(shù)據(jù),同時(shí)通過(guò)整合數(shù)據(jù)增強(qiáng)了大模型的上下文,可以生成更精確、更翔實(shí)且更具吸引力的回答。

然而,RAG 能夠讓 AI 獲取更多數(shù)據(jù)來(lái)提升回答質(zhì)量,卻不能解決數(shù)據(jù)獲取數(shù)量和質(zhì)量的問(wèn)題。

而 Kimi 探索版最讓人驚艷的一個(gè)升級(jí),恰恰就是面對(duì)大規(guī)模數(shù)據(jù)的檢索能力。按照官方提供的數(shù)據(jù),在標(biāo)準(zhǔn)版的基礎(chǔ)上,Kimi 探索版的「大腦容量」劇增,支持 10 倍的搜索量,「一次搜索即可精讀超過(guò) 500 個(gè)頁(yè)面?!?/strong>

小雷體驗(yàn)過(guò)程中也看到了這項(xiàng)升級(jí)帶來(lái)的巨大潛力。

在提出問(wèn)題后,Kimi 探索版會(huì)把問(wèn)題拆解為不同的子任務(wù)后,每執(zhí)行一個(gè)子任務(wù),都會(huì)單獨(dú)搜索和閱讀相關(guān)資料。比如「專碩申請(qǐng)」拆解成 11 個(gè)任務(wù)單獨(dú)搜索,同時(shí)閱讀了 48 個(gè)網(wǎng)頁(yè)。

但當(dāng)我請(qǐng) Kimi 探索版「總結(jié)全球主要科研機(jī)構(gòu)對(duì)量子計(jì)算的最新進(jìn)展,包括英文、中文、法語(yǔ)和德語(yǔ)的權(quán)威論文和研究,并分析其中的趨勢(shì)」,Kimi 探索版最終拆分成了 25 個(gè)任務(wù)進(jìn)行執(zhí)行,并閱讀了 310 個(gè)網(wǎng)頁(yè)。

圖/雷科技

相比之下,其他 AI 智能助手或者 AI 搜索,往往依賴單一關(guān)鍵字的簡(jiǎn)單查詢,一次搜索僅處理幾個(gè)頁(yè)面的信息,給出的結(jié)果不夠全面,很多時(shí)候需要用戶自己再去做篩選和判斷,更不用說(shuō)要面對(duì)巨大工作量的任務(wù)。

又比如官方測(cè)試過(guò)的實(shí)例,讓 Kimi 探索版在 2024 年《財(cái)富》中國(guó)科技 50 強(qiáng)公司找出總部位于北京的公司,也遍覽了 276 個(gè)網(wǎng)頁(yè)。

圖/ Kimi

這些問(wèn)題的解答,都需要建立在龐大數(shù)據(jù)檢索量的前提上。不同的是,過(guò)去我們依賴已有答案或者手動(dòng)一個(gè)個(gè)搜索,但現(xiàn)在 Kimi 探索版就可以實(shí)現(xiàn)自主地海量搜索。

至于 Kimi 探索版的自我反思,可能是更多面向開(kāi)放式的問(wèn)題,實(shí)際有限的測(cè)試中很少出現(xiàn),還沒(méi)有太深的體會(huì)。不過(guò)也看出,Kimi 探索版可能會(huì)在回答問(wèn)題,重新閱讀回答進(jìn)行補(bǔ)充。

Kimi 探索版只是探索,但方向是真對(duì)了

小到查找優(yōu)質(zhì)高校專業(yè)的申請(qǐng)信息,大到了解全球量子計(jì)算的科研前沿,當(dāng)小雷從 Kimi 探索版得到回答的那一刻,多少還是有些難以置信。并不是這些問(wèn)題因?yàn)閷?duì)人類來(lái)說(shuō)太難,而是在可靠回答之上,超越想象的速度,或者說(shuō)效率。

很多人都知道,作為全球最大的搜索引擎公司,谷歌的使命是「整合全球信息,供大眾使用,讓人人受益」。但傳統(tǒng)搜索引擎可以整合,卻無(wú)法化繁為簡(jiǎn),讓我在海量的信息快速、便捷地找到想要的信息。

與此同時(shí),Kimi 探索版通過(guò)理解問(wèn)題、分拆任務(wù)執(zhí)行,大幅提高檢索能力以及自我反思,在一定程度上解決了生成式 AI 的部分難題。具體到回答結(jié)果上,Kimi 探索版也確實(shí)帶來(lái)了不小的驚喜。

圖/雷科技

當(dāng)然也存在一些問(wèn)題,比如大模型的「幻覺(jué)」,回答中字節(jié)跳動(dòng)的研發(fā)支出實(shí)際是引用 2022 年的數(shù)據(jù)。

又比如在理解用戶意圖上,AI 還是很長(zhǎng)的路要走。當(dāng)我詢問(wèn) Kimi 探索版 2024 年 QS 排名前 100 中國(guó)高校計(jì)算機(jī)專業(yè)的專碩申請(qǐng)情況,但實(shí)際卻給出了 QS 排名 100 開(kāi)外甚至不在排名內(nèi)的高校情況。

此外,目前內(nèi)測(cè)的 Kimi 探索版,在推理能力可能還是要弱于 o1-preview,至少面對(duì)一個(gè)模糊提問(wèn)的時(shí)候,Kimi 探索版并沒(méi)有給出有用的信息,o1-preview 卻能根據(jù)信息推理出是 Ben Thompson 提出的「聚合理論」(Aggregation Theory)。

圖/雷科技

當(dāng)然,我們可能還是需要更長(zhǎng)時(shí)間、更多提問(wèn)才能發(fā)現(xiàn) Kimi 探索版的真正能力。但不論如何,我都相信 OpenAI o1 和 Kimi 探索版找到了一條通往 AGI(通用人工智能)的正確方向。

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司