本報訊 (記者袁傳璽)1月20日,國內(nèi)兩家備受關(guān)注的人工智能大模型創(chuàng)業(yè)公司北京月之暗面科技有限公司(以下簡稱“月之暗面”)(Kimi)和杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡稱“深度求索”)(DeepSeek)均發(fā)布了最新模型。
在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,多模態(tài)思考模型實現(xiàn)了SOTA級別多模態(tài)推理和通用推理能力。在short-CoT模式下,Kimik1.5的數(shù)學(xué)、代碼、視覺多模態(tài)和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet。在long-CoT模式下,Kimi k1.5的數(shù)學(xué)、代碼、多模態(tài)推理能力達(dá)到了OpenAI o1正式版的水平。月之暗面表示,這應(yīng)該是全球范圍內(nèi),首次有OpenAI之外的公司實現(xiàn)o1正式版的多模態(tài)推理性能。
深度求索發(fā)布的DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用強化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼和自然語言推理等任務(wù)上,R1的性能也可以比肩o1正式版。同時根據(jù)DeepSeek公布的測試數(shù)據(jù),R1在美國AIME 2024、MATH-500和SWE-bench Verified測試中的比分均高于OpenAI o1。
與OpenAI不同,這兩家公司都公開了原理及技術(shù)報告:Kimik1.5發(fā)布原創(chuàng)技術(shù)long2short,高效思維鏈+原生多模,DeepSeek-R1則繼續(xù)主打高性價比。
中央民族大學(xué)教授郭全中表示:“中國AI公司之前基本都在摸著OpenAI的石頭過河,但從K1.5等國產(chǎn)大模型開始,以硅谷為中心的格局已悄然發(fā)生變動。國產(chǎn)大模型的突破不僅在于技術(shù)指標(biāo)的提升,也展示了中國AI技術(shù)正在走向自主創(chuàng)新的新階段。期待看到更多中國企業(yè)在全球AI舞臺上展現(xiàn)實力,推動人工智能技術(shù)向著更高水平邁進。”
(編輯 張鈺鵬)
多地召開“新春第一會” 高質(zhì)量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結(jié)束,全國多地在蛇年首個工作……[詳情]
10:13 | 上市公司年報披露收官:近五成公司... |
23:23 | 2024年度深市上市公司業(yè)績穩(wěn)中有進... |
22:27 | 以點帶面 穩(wěn)鏈強鏈 2024年度科創(chuàng)... |
22:26 | 出口含“新”量更足!滬市主板公司... |
22:23 | 證監(jiān)會公布《證券期貨業(yè)統(tǒng)計指標(biāo)標(biāo)... |
21:59 | 基礎(chǔ)穩(wěn)、韌性強 滬市主板公司2024... |
21:52 | 澄天偉業(yè):第五屆監(jiān)事會第三次會議... |
21:52 | 錦波生物:第四屆董事會第十次會議... |
21:52 | 中遠(yuǎn)通:第三屆董事會第三次會議決... |
21:52 | 迪森股份:第九屆董事會第一次會議... |
21:52 | 天力鋰能:第四屆監(jiān)事會第十次會議... |
21:52 | 正川股份:2024年年度股東大會決議... |
版權(quán)所有證券日報網(wǎng)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:[email protected]
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注