在當(dāng)今的人工智能領(lǐng)域,多輪對(duì)話機(jī)器人的情感分析可是個(gè)熱門(mén)話題。今天就來(lái)給大家詳細(xì)聊聊它的幾種方法。


機(jī)器人對(duì)話


1、基于機(jī)器學(xué)習(xí)的方法


監(jiān)督式學(xué)習(xí)方法,得用帶有情感標(biāo)簽的訓(xùn)練數(shù)據(jù)集來(lái)訓(xùn)練模型,就像在多輪對(duì)話場(chǎng)景下,收集大量已標(biāo)注情感的對(duì)話樣本,像積極、消極或中性情感標(biāo)簽的對(duì)話輪次數(shù)據(jù)。常用的算法有支持向量機(jī)、樸素貝葉斯等。


這種方法準(zhǔn)確率高,但需要大量人工標(biāo)注數(shù)據(jù),成本可不低。無(wú)監(jiān)督式學(xué)習(xí)方法呢,不用帶情感標(biāo)簽的訓(xùn)練集,通過(guò)聚類等技術(shù)發(fā)現(xiàn)情感信息。在多輪對(duì)話中,對(duì)整體文本分析,像用K - Means聚類算法等。成本低能處理大規(guī)模文本,但準(zhǔn)確率和穩(wěn)定性可能稍差。


還有半監(jiān)督式學(xué)習(xí)方法,結(jié)合了前兩者的思想,用少量有標(biāo)簽和大量無(wú)標(biāo)簽數(shù)據(jù)訓(xùn)練模型。比如人工精選有代表性情感的對(duì)話輪次作為有標(biāo)簽數(shù)據(jù),日常對(duì)話積累作為無(wú)標(biāo)簽數(shù)據(jù)。它能利用無(wú)標(biāo)簽數(shù)據(jù)提高性能,不過(guò)對(duì)數(shù)據(jù)分布和質(zhì)量敏感。


2、基于深度學(xué)習(xí)的方法


循環(huán)神經(jīng)網(wǎng)絡(luò)及其變體,像RNN能處理序列數(shù)據(jù),在多輪對(duì)話中逐輪處理文本,考慮前后輪次語(yǔ)義關(guān)聯(lián)。LSTM和GRU能更好處理長(zhǎng)序列依賴關(guān)系。比如在分析長(zhǎng)輪次對(duì)話時(shí),能記住關(guān)鍵情感信息。


卷積神經(jīng)網(wǎng)絡(luò)能自動(dòng)學(xué)習(xí)文本特征表示,對(duì)每輪對(duì)話文本卷積操作提取局部特征,再綜合判斷情感傾向。變換器基于自注意力機(jī)制,能處理長(zhǎng)距離依賴關(guān)系,在多輪對(duì)話涉及多主題切換時(shí),能更好捕捉情感關(guān)聯(lián)。


3、基于詞典的方法


通過(guò)預(yù)定義情感詞典識(shí)別文本情感傾向。在多輪對(duì)話中,對(duì)每輪詞語(yǔ)匹配查找,根據(jù)詞典中詞匯的情感極性判斷輪次情感傾向,再綜合多輪結(jié)果分析整個(gè)對(duì)話情感。


4、混合方法


把前面幾種方法結(jié)合起來(lái),比如先用詞典方法初步判斷每輪對(duì)話情感,再用深度學(xué)習(xí)模型進(jìn)一步分析考慮多輪語(yǔ)義關(guān)聯(lián)后的準(zhǔn)確情感,最后用機(jī)器學(xué)習(xí)方法校準(zhǔn)結(jié)果,這樣能提高多輪對(duì)話情感分析的準(zhǔn)確性。