阿里云發(fā)布通義千問2.5
2024-05-09 14:30
文本設(shè)置
小號
默認(rèn)
大號
Plus(0條)
5月9日,阿里云正式發(fā)布通義千問2.5。阿里云方面表示,該模型性能全面趕超GPT-4Turbo。阿里云表示,在權(quán)威基準(zhǔn)OpenCompass上,通義千問2.5得分追平GPT-4Turbo,是國產(chǎn)大模型首次在該基準(zhǔn)取得該項成績。 | 相關(guān)閱讀(第一財經(jīng))
45
裕棠
追求內(nèi)心的平靜和安寧
今年4月,清華大學(xué)基礎(chǔ)模型研究中心聯(lián)合中關(guān)村實(shí)驗室發(fā)布了2024年3月版《SuperBench大模型綜合能力評測報告》,報告認(rèn)為,在中文推理、中文語言等評測上,文心一言遙遙領(lǐng)先,和其他模型拉開明顯差距,中文理解上,文心一言4.0領(lǐng)先優(yōu)勢明顯,領(lǐng)先第二名GLM-4 0.41分,GPT-4系列模型表現(xiàn)較差,排在中下游,并且和第一名文心一言4.0分差超過1分。
如今通義千問也是在“中文語境下”趕超GPT-4。但我想說的是,對于中文,國內(nèi)的公司強(qiáng)一點(diǎn)也是正常的,但還是要看到差距的是,GPT-4幾乎覆蓋了所有的語言,因此是全球的大模型,其應(yīng)用還是要更加廣泛一些,國內(nèi)的互聯(lián)網(wǎng)公司大可把眼光放長遠(yuǎn)和寬泛一些,不要老是想著只在“中文”上超越國際競爭對手。
26
懿德資本
文心一言不敢恭維、李彥宏強(qiáng)調(diào)說某些方面超過G PT4了、比如詩詞方面。我評論說現(xiàn)在年輕人誰好做實(shí)習(xí)、那還不如說文言文方面更勝一籌呢,結(jié)果我的評論就被屏蔽了。不是鼓吹國外的東西、都是付費(fèi)版本、文心一言就是個小學(xué)生、回答問題不會變通、一板一眼的回答。而GPT4目前最低也算高中生、回答問題的邏輯性、拓展性都還可以的。