央廣網(wǎng)科技6月24日消息 6月23-24日,知乎舉辦了一場“陰陽怪氣”主題書法展,現(xiàn)場知乎社區(qū)治理團(tuán)隊(duì)首次亮相,分享了知乎在識別陰陽怪氣類內(nèi)容上的探索。知乎借助AI技術(shù),并輔以人機(jī)結(jié)合和多元的產(chǎn)品舉措,多重手段加強(qiáng)對社區(qū)氛圍的維護(hù)。據(jù)悉,現(xiàn)階段知乎已實(shí)現(xiàn)對95%以上的違法違規(guī)、廣告導(dǎo)流和不友善等內(nèi)容的主動打擊、覆蓋和篩查 。
在知乎看來,陰陽怪氣通常以“不針對發(fā)言內(nèi)容,而是批評對方的語氣”以及“提出反對意見,但不給或給出極少數(shù)論據(jù)支持”這兩類常見言論為代表,此類評論極大了傷害創(chuàng)作者和交流者的體驗(yàn),但難以解決。
解決陰陽怪氣類評論的難點(diǎn)核心主要在于網(wǎng)絡(luò)語言的復(fù)雜性,情感分析不同于普通文本分析。由于雙方不同關(guān)系、說話的不同場景和時間都會帶來迥然不同的表意。即便是人工判定都存在標(biāo)準(zhǔn)化難度,算法模型的訓(xùn)練挑戰(zhàn)就更為艱辛。
知乎運(yùn)營總監(jiān)孫達(dá)云、內(nèi)容質(zhì)量管理團(tuán)隊(duì)技術(shù)負(fù)責(zé)人劉兆來分別從運(yùn)營、技術(shù)角度,對知乎在構(gòu)建良性社區(qū)氛圍上所做的努力進(jìn)行了闡述。在過去一年里,知乎不斷優(yōu)化算法機(jī)器人“瓦力”,著力挑戰(zhàn)識別陰陽怪氣這一情感分析領(lǐng)域的傳統(tǒng)難題,通過綜合使用情感模型、用戶親密度模型和文本識別模型,其識別準(zhǔn)確率得以大幅優(yōu)化,已超過大部分人工判斷。
針對陰陽怪氣評論通常表達(dá)負(fù)面情感的特點(diǎn),知乎構(gòu)建了內(nèi)容情感傾向性識別的算法模型和識別用戶親密度的模型,并通過訓(xùn)練不斷迭代完善。此外,針對陰陽怪氣評論的典型特征,知乎建立了文本識別模型不斷標(biāo)記訓(xùn)練樣本。三大模型的結(jié)合,不僅擺脫單一算法模型的局限性,也讓“瓦力”的陰陽怪氣識別準(zhǔn)確率超過了大多數(shù)人工判斷。
據(jù)了解,知乎還將在近期對該技術(shù)進(jìn)行產(chǎn)品化嘗試,向用戶提供“瓦力”陰陽怪氣智能過濾選項(xiàng),同時,還將對“瓦力”進(jìn)行更多訓(xùn)練,不斷提升準(zhǔn)確率和召回率,最終將陰陽怪氣識別技術(shù)全面應(yīng)用到社區(qū)治理中。
知乎不斷在社區(qū)治理方面加大AI技術(shù)投入,通過陰陽怪氣評論的治理,探索了一條優(yōu)化互聯(lián)網(wǎng)社交禮儀的創(chuàng)新之路。對于飽受網(wǎng)絡(luò)暴力困擾的用戶而言,陰陽怪氣識別技術(shù)能夠讓用戶更舒適地參與網(wǎng)絡(luò)討論。
關(guān)鍵詞: 互聯(lián)網(wǎng) 社交 算法