展會(huì)信息港展會(huì)大全

月之暗面發(fā)布數(shù)學(xué)大模型,對(duì)標(biāo)OpenAI o1
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-20 21:27:13   瀏覽:325次  

導(dǎo)讀:圖片來源:視覺中國中國人工智能正在快速追趕OpenAI。11月16日下午,中國通用人工智能公司月之暗面宣布:發(fā)布數(shù)學(xué)大模型k0-math。這是該公司首次推出推理能力強(qiáng)化模型產(chǎn)品。按照該公司的說法,k0-math的數(shù)學(xué)能力可對(duì)標(biāo)全球領(lǐng)先的OpenAI o1系列可公開使用的兩個(gè)模型o1-mini和o1-preview。具體而言,在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測(cè)試MATH中,k0-math模型得分93.8分,超過o1-mini ......

月之暗面發(fā)布數(shù)學(xué)大模型,對(duì)標(biāo)OpenAI o1

圖片來源:視覺中國

中國人工智能正在快速追趕OpenAI。

11月16日下午,中國通用人工智能公司月之暗面宣布:發(fā)布數(shù)學(xué)大模型k0-math。這是該公司首次推出推理能力強(qiáng)化模型產(chǎn)品。

按照該公司的說法,k0-math的數(shù)學(xué)能力可對(duì)標(biāo)全球領(lǐng)先的OpenAI o1系列可公開使用的兩個(gè)模型o1-mini和o1-preview。

具體而言,在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測(cè)試MATH中,k0-math模型得分93.8分,超過o1-mini的90分和o1-preview的85.5分。k0-math這一成績僅次于o1完全版的94.8分。

需要注意的是,k0-math模型雖然擅長解答大部分有難度的數(shù)學(xué)問題,但是當(dāng)前版本還無法解答難以描述的幾何圖形類問題。

此外,這款產(chǎn)品還有一些局限性需要突破,包括對(duì)于過于簡(jiǎn)單的數(shù)學(xué)問題,例如1+1=?這類問題時(shí)k0-math模型可能會(huì)“過度思考”,回答出一些偏離常識(shí)的答案。

月之暗面創(chuàng)始人楊植麟在回答《財(cái)富》的問題時(shí)表示:對(duì)于強(qiáng)化學(xué)習(xí)而言,“數(shù)據(jù)”是一個(gè)核心問題,如果未來能夠把大模型的獎(jiǎng)勵(lì)機(jī)制做好,將會(huì)避免不必要的“過度思考”。“我們現(xiàn)在沒有答案的長度做任何的限制,讓人工智能自由的思考,也許可以通過改變獎(jiǎng)勵(lì)結(jié)構(gòu)的方式,抑制過度思考,這是我們接下來想去解決的問題。”他說。

月之暗面是中國估值最高的人工智能大模型公司之一。

Kimi智能助手則是月之暗面旗下的核心產(chǎn)品,目前它擁有3,600萬用戶。據(jù)阿里財(cái)報(bào)披露,阿里巴巴在2024財(cái)年投資8億美元,購入月之暗面36%股權(quán),可知彼時(shí)月之暗面估值約22億美元。今年5月,騰訊、高榕資本等新資方加入,這也推動(dòng)了月之暗面估值超過30億美元。

31歲的楊植麟畢業(yè)于清華大學(xué),并獲得美國卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)博士,他曾在Meta AI和Google AI研發(fā)團(tuán)隊(duì)工作。

在過去一年,Kimi經(jīng)歷了高速增長。

由于Kimi支持200萬字的無損上下文輸入,在文本解析和長文本處理方面表現(xiàn)出色。這一優(yōu)勢(shì)使其在閱讀理解、文獻(xiàn)分析、長文寫作等任務(wù)上具有獨(dú)特優(yōu)勢(shì)。2024年4月,Kimi智能助手網(wǎng)頁版訪問量達(dá)到2,004萬,較上月上漲60.2%,訪問量超過百度的文心一言。

當(dāng)下,中國基礎(chǔ)大模型公司競(jìng)爭(zhēng)激烈,包括騰訊、百度、阿里巴巴以及字節(jié)跳動(dòng)在內(nèi)的各個(gè)公司都推出了大模型產(chǎn)品。

在競(jìng)爭(zhēng)版圖中,字節(jié)跳動(dòng)旗下產(chǎn)品“豆包”正在成為Kimi最可怕的競(jìng)爭(zhēng)者。

11月初,在AI產(chǎn)品榜(aicpb.com)的全球總榜(App)上,豆包位列第二,僅次于ChatGPT。年初至今,豆包的累計(jì)下載量已經(jīng)突破1億。就中國而言排名前三的分別是豆包與百度旗下的文小言以及Kimi,月活躍用戶數(shù)均超千萬。

在回應(yīng)與豆包的競(jìng)爭(zhēng)時(shí),楊植麟表示,他并不太關(guān)注競(jìng)爭(zhēng)本身!耙?yàn)楦?jìng)爭(zhēng)本身不產(chǎn)生價(jià)值!彼f,“只有推出更好的技術(shù)和產(chǎn)品,才能給用戶創(chuàng)造更大價(jià)值,這是我們現(xiàn)在最核心的問題!

楊植麟最為關(guān)注的數(shù)據(jù)是用戶留存率。他認(rèn)為現(xiàn)在Kimi僅僅達(dá)到通用人工智能的初級(jí)階段,用戶留存率這一指標(biāo)與技術(shù)成熟度正相關(guān),隨著技術(shù)不斷提升,kimi的用戶留存率會(huì)自然提升。他并沒有正面回答現(xiàn)在kimi的用戶留存率為多少,只表示這個(gè)數(shù)據(jù)的提升需要“永無止境”。

不過,《財(cái)富》對(duì)話的多位投資人以及Kimi競(jìng)爭(zhēng)對(duì)手均表示,目前并未體驗(yàn)到k0-math產(chǎn)品,對(duì)其功能和實(shí)際效果無法給出評(píng)價(jià)。

Kimi不斷推出新產(chǎn)品反映了中美人工智能領(lǐng)域的競(jìng)爭(zhēng)。業(yè)界普遍認(rèn)為,人工智能主要由算法、算力和數(shù)據(jù)三大要素組成,在算力層面,美國擁有絕對(duì)優(yōu)勢(shì);在算法層面,中國公司正在逐步追趕;而在數(shù)據(jù)和應(yīng)用場(chǎng)景層,中國擁有將人工智能應(yīng)用到各個(gè)場(chǎng)景中,并獲得有效使用數(shù)據(jù)的能力,這是一大優(yōu)勢(shì)。(財(cái)富中文網(wǎng))

在財(cái)富Plus,網(wǎng)友們對(duì)這篇文章發(fā)表了許多有深度和思想的觀點(diǎn)。一起來看看吧。也歡迎你加入我們,談?wù)勀愕南敕。今日其他熱議話題:

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港