(資料圖片)
7月2日,“2023全球數(shù)字經(jīng)濟(jì)大會(huì)-人工智能高峰論壇”在北京舉辦。度小滿CTO許冬亮等嘉賓受邀發(fā)表演講,并圍繞“AI大模型應(yīng)用的‘發(fā)展之道’”話題展開討論。
“對(duì)比于通用大模型的能力而言,金融行業(yè)非常需要垂直行業(yè)大模型”,許冬亮表示,“在數(shù)據(jù)層面,金融行業(yè)因?yàn)榘踩半[私保護(hù)要求數(shù)據(jù)大多存儲(chǔ)在本地,通用大模型在金融能力上缺乏必要的訓(xùn)練數(shù)據(jù)。另外一方面,金融行業(yè)在風(fēng)控、精度等方面要求較高,系統(tǒng)又比較復(fù)雜,再加上金融相關(guān)數(shù)據(jù)實(shí)時(shí)性的要求很高,所以從這幾個(gè)維度去看,通用大模型的金融常識(shí)、生成的可控性和準(zhǔn)確性都達(dá)不到這個(gè)行業(yè)的最低要求,需要針對(duì)金融機(jī)構(gòu)定制的行業(yè)大模型去發(fā)揮效力”。
今年五月,度小滿宣布正式開源國(guó)內(nèi)首個(gè)千億級(jí)中文金融大模型“軒轅”。軒轅大模型是在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來,在金融名詞理解、金融市場(chǎng)評(píng)論、金融數(shù)據(jù)分析和金融新聞理解等任務(wù)上, 表現(xiàn)出明顯的金融領(lǐng)域優(yōu)勢(shì),在金融任務(wù)測(cè)試集中相較于基座模型效果提升70%以上。
許冬亮認(rèn)為,“軒轅”大模型運(yùn)用獨(dú)創(chuàng)的hybrid-tuning方式,基于度小滿實(shí)際業(yè)務(wù)場(chǎng)景積累的海量金融數(shù)據(jù)進(jìn)行訓(xùn)練,保證在提升金融能力的同時(shí),不會(huì)損失通用能力。
度小滿“軒轅”大模型在金融任務(wù)評(píng)測(cè)中,全面超越了主流的開源大模型,贏得了150次回答中63.33%的勝率。在通用能力評(píng)測(cè)中,軒轅有10.2%的任務(wù)表現(xiàn)超越ChatGPT 3.5, 61.22%的任務(wù)表現(xiàn)與之持平,涉及數(shù)學(xué)計(jì)算、場(chǎng)景寫作、邏輯推理、文本摘要等13個(gè)主要維度。
金融機(jī)構(gòu)對(duì)行業(yè)大模型的應(yīng)用熱情高漲。許冬亮透露,“軒轅”大模型開源一個(gè)月的時(shí)間,已經(jīng)有上百家金融機(jī)構(gòu)在試用。他認(rèn)為,行業(yè)大模型將幫助積極擁抱大模型的中小金融機(jī)構(gòu)縮小與頭部機(jī)構(gòu)的技術(shù)差距?!敖鹑谛袠I(yè)有非常多的中小機(jī)構(gòu),它們的業(yè)務(wù)規(guī)模和科技能力都和頭部機(jī)構(gòu)有明顯差距,在大模型時(shí)代,所有金融機(jī)構(gòu)都能用先進(jìn)的金融大模型來解決自己的業(yè)務(wù)問題,大家重新站在同一起跑線上,這是中小機(jī)構(gòu)跨越‘?dāng)?shù)字鴻溝’和‘智能化鴻溝’的機(jī)遇”。
關(guān)鍵詞: