你知道知識圖譜嗎?它可是一種很神奇的東西,旨在描述真實世界中的各種實體或概念。


智能客服.jpg


1、知識圖譜的表示和在搜索中的展現(xiàn)形式


每個實體或概念都有一個獨特的標(biāo)識符,就像我們每個人都有一個獨一無二的身份證號一樣。


而且,還有屬性 - 值對來描述實體的特性,關(guān)系來連接不同的實體。它可以用資源描述框架RDF或?qū)傩詧D來表示,就像一幅巨大的圖,節(jié)點是實體或概念,邊是屬性或關(guān)系。


2、知識圖譜在搜索中的應(yīng)用


其中最常見的就是知識卡片。知識卡片會為用戶提供與搜索內(nèi)容相關(guān)的詳細結(jié)構(gòu)化摘要。比如你搜索“姚明”,它會列出姚明的身高、體重等信息。


不同的搜索引擎展現(xiàn)形式還有些差異呢。Google可能會展示很多相關(guān)圖片;百度會結(jié)合百度風(fēng)云榜信息,列出類別和百度指數(shù)等,還在左上角有專題搜索。


搜狗就更厲害了,輸入復(fù)雜查詢像“姚明的老婆的女兒的身高”,它能直接返回答案和推理過程。


而且當(dāng)遇到有歧義的查詢,比如搜索“李娜”,知識卡片還會列出不同的“李娜”供你選擇。


3、知識圖譜是的構(gòu)建


它的規(guī)??刹恍?。Google的知識圖譜包含了5億個實體和35億條事實,還是面向全球的,有多種語言描述。


百度和搜狗主要針對中文搜索,規(guī)模略小一些。它的數(shù)據(jù)來源主要是百科類站點和垂直站點的結(jié)構(gòu)化數(shù)據(jù)。


構(gòu)建過程也很復(fù)雜,包括數(shù)據(jù)獲取,從百科知識、新聞文章等收集數(shù)據(jù);信息抽取,像實體抽取、關(guān)系抽取和屬性抽?。恢R融合,解決指代消解、實體消歧等問題;還有知識加工,包括本體構(gòu)建和知識推理,最后還要進行質(zhì)量評估。


4、知識圖譜在搜索中的應(yīng)用


它可以直接提供答案,像搜狗知立方那樣,提高搜索效率和準(zhǔn)確性。還能豐富搜索結(jié)果展示,通過知識卡片給我們更多信息。也能解決查詢歧義的問題。