“假如我們現(xiàn)在不是用國產(chǎn)平臺,而是用已經(jīng)成型的英偉達的平臺,我們今天發(fā)布的星火3.0的效果可能還會更好,但這一步我們非走不可。”在聯(lián)合華為發(fā)布“飛星一號”大模型算力平臺后,科大訊飛董事長劉慶峰接受《財富》采訪時表示。
10月24日,科大訊飛承辦的第六屆世界聲博會暨2023科大訊飛全球1024開發(fā)者節(jié)在安徽省合肥市舉辦。科大訊飛發(fā)布了訊飛星火認知大模型3.0版本,據(jù)稱該模型綜合能力已經(jīng)超越國內(nèi)同行,在文本生成、語言理解、知識回答、邏輯推理、數(shù)學能力等七大能力上均持續(xù)提升。劉慶峰在會上表示,訊飛星火3.0通用模型將全面對標ChatGPT,中文能力已超越ChatGPT,英文能力與之相當。
“飛星一號”則是科大訊飛基于華為昇騰生態(tài)開發(fā)的大模型算力平臺。雖然科大訊飛方面沒有公布更新版大模型的具體參數(shù),但劉慶峰透露,這是首個真正在國產(chǎn)算力平臺上訓練出來的大模型,訊飛和華為“聯(lián)合特戰(zhàn)隊”半年內(nèi)就將星火大模型訓練和推理效率翻番,而“飛星一號”平臺的發(fā)布意味著訊飛正式啟動對標GPT-4更大參數(shù)規(guī)模的星火大模型訓練。
“‘飛星一號’這個平臺發(fā)布的背后,最大的壓力是我們在做這件事情的過程中自己的心態(tài),因為本來用英偉達可能一個月就能干成的事情,但我們與華為攜手克服各種不確定性,可能三個月才能干完。所以當時最大的困難就是我們在快速奔跑的過程中,別人用的最豪華的武器,而我們要一邊打仗,一邊磨練武器,或者說一邊要賺錢一邊要比別人投入更多,這很考驗我們的心態(tài),但這對我們未來長期戰(zhàn)略是非常重要的。”他在接受采訪時坦言道。
科大訊飛10月19日發(fā)布的財報顯示,前三季度實現(xiàn)營業(yè)收入126億元,同比小幅下滑0.27%;歸屬凈利潤9936萬元,同比下滑76%。其中,第三季度凈利潤僅為2579萬元,同比下滑82%。其解釋稱利潤下滑主要原因系公司積極搶抓通用人工智能的歷史新機遇,在通用人工智能認知大模型等方面堅定投入。前三季度科大訊飛開發(fā)支出逾10億元,同比增長約44%。
另外,在此前發(fā)布的半年報中,科大訊飛凈利潤出現(xiàn)了73.54%的下滑,其解釋原因為公司應對美國極限施壓,加大了在核心技術自主可控和產(chǎn)業(yè)鏈可控等方面的投入。
盡管訊飛星火3.0已取得一定突破,但劉慶峰表示,國產(chǎn)大模型必須正視和GPT-4的差距。“國產(chǎn)大模型在復雜知識推理、小樣本快速學習、超長文本處理、跨模態(tài)統(tǒng)一理解上距GPT4還有差距。唯有實事求是的科學精神,才能真正實現(xiàn)超越。”
他預計對標GPT-4的目標有望于2024年上半年實現(xiàn),屆時星火4.0大模型將會發(fā)布。
“我也不希望大家覺得我們老在蹭華為的熱點,但華為確實有很多值得我們學習的。訊飛是典型的高校科技成果,可以說是學生創(chuàng)業(yè),我們在核心技術上夢想很多,商業(yè)化能力還是很弱的,所以要向他們多學習。無論是盈利能力還是管理能力,我們跟華為的差距都還挺大的。當然我們可能一樣都有夢想。”在談及科大訊飛是否是“微縮版華為”時,劉慶峰表示。(財富中文網(wǎng))