【資料圖】
本報記者 李喬宇
3月9日,中文在線在投資者互動平臺上表示,在AI領(lǐng)域3大核心是數(shù)據(jù)、算力、算法,數(shù)據(jù)對于如ChatGPT等AI模型的意義重大,高質(zhì)量的數(shù)據(jù)資源可讓數(shù)據(jù)變成資產(chǎn)、變成核心生產(chǎn)力,AI模型的生產(chǎn)內(nèi)容高度依賴源頭數(shù)據(jù)。
中文在線方面稱,公司深耕文化數(shù)字產(chǎn)業(yè)20余年,擁有海量的正版中文數(shù)據(jù)資源,公司在數(shù)據(jù)的優(yōu)勢有4個:第1個是海量,公司擁有的中文文字字數(shù)超萬億字,內(nèi)容品類包含小說類、科普類、社會類、經(jīng)管類、法律類,教育教材類等等;第2個是高質(zhì)量,公司擁有的數(shù)字內(nèi)容經(jīng)過市場長期校驗,已形成高質(zhì)量的數(shù)據(jù)內(nèi)容庫,而高質(zhì)量的數(shù)據(jù)可大幅提升模型訓(xùn)練效果,縮短學(xué)習時間和提升學(xué)習質(zhì)量,讓AI模型產(chǎn)出內(nèi)容穩(wěn)定;第3個是正版版權(quán),公司自成立之初一直秉承“先授權(quán)、后傳播”的原則,高度重視知識產(chǎn)權(quán)保護工作,擁有旗下數(shù)字內(nèi)容從數(shù)字版權(quán)到全部版權(quán)的權(quán)利,可為AI模型公司提供擁有版權(quán)的數(shù)據(jù)集用于訓(xùn)練;第4個是完整的各類型商業(yè)生態(tài)鏈,如公司擁有網(wǎng)絡(luò)原創(chuàng)駐站作者440余萬名,可實時反饋最新數(shù)據(jù),提供最貼近市場和用戶的最新數(shù)據(jù),讓AI模型持續(xù)更新學(xué)習。未來,公司也將充分發(fā)揮公司的數(shù)據(jù)優(yōu)勢,持續(xù)為行業(yè)賦能。
(編輯 張偉)
關(guān)鍵詞: