龍巖第一社區

查看:1915 回復:0 發表于 2018-11-3 07:17
  • TA的每日心情
    慵懶
    2018-8-5 11:22
  • 跳轉到指定樓層
    樓主
    發表于 2018-11-3 07:17:05 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式

    知識圖譜構建的關鍵技術 [復制鏈接]

    知識圖譜構建的關鍵技術

    大規模知識庫的構建與應用需要多種技術的支持。通過知識提取技術,可以從一些公開的半結構化、非結構化和第三方結構化數據庫的數據中提取出實體、關系、屬性等知識要素。

    知識圖譜構建技術應用表示則通過一定有效手段對知識要素表示,便于進一步處理使用。然后通過知識融合,可消除實體、關系、屬性等指稱項與事實對象之間的歧義,形成高質量的知識庫。知識推理則是在已有的知識庫基礎上進一步挖掘隱含的知識,從而豐富、擴展知識庫。

    接下來,本文將以知識抽取、知識表示、知識融合及知識推理技術為重點,選取代表性的方法,說明其中的相關研究進展和實用技術手段 。

    1 知識抽取

    知識抽取主要是面向開放的鏈接數據,通常典型的輸入是自然語言文本或者多媒體內容文檔等。然后通過自動化或者半自動化的技術抽取出可用的知識單元,知識單元主要包括實體、關系以及屬性3個知識要素,并以此為基礎,形成一系列高質量的事實表達,為上層模式層的構建奠定基礎。

    1.1 實體抽取

    實體抽取也稱為命名實體學習或命名實體識別,指的是從原始數據語料中自動識別出命名實體。由于實體是知識圖譜中的最基本元素,其抽取的完整性、準確率、召回率等將直接影響到知識圖譜構建的質量。

    我們將實體抽取的方法分為4種:基于百科站點或垂直站點提取、基于規則與詞典的方法、基于統計機器學習的方法以及面向開放域的抽取方法。

    1.2 語義類抽取

    語義類抽取是指從文本中自動抽取信息來構造語義類并建立實體和語義類的關聯, 作為實體層面上的規整和抽象。有一種行之有效的語義類抽取方法,包含三個模塊:并列度相似計算、上下位關系提取以及語義類生成。

    1.3 屬性和屬性值抽取

    屬性提取的任務是為每個本體語義類構造屬性列表,而屬性值提取則為一個語義類的實體附加屬性值。屬性和屬性值的抽取能夠形成完整的實體概念的知識圖譜維度。

    1.4 關系抽取

    關系抽取的目標是解決實體語義鏈接的問題。關系的基本信息包括參數類型、滿足此關系的元組模式等。

    2 知識表示

    傳統的知識表示方法主要是以RDF(Resource Deion Framework資源描述框架)的三元組SPO(subject,predicate,object)來符號性描述實體之間的關系。但是其在計算效率、數據稀疏性等方面面臨諸多問題。

    近年來,以深度學習為代表的學習技術取得了重要的進展,可以將實體的語義信息表示為稠密低維實值向量,進而在低維空間中高效計算實體、關系及其之間的復雜語義關聯,對知識庫的構建、推理、融合以及應用均具有重要的意義。

    2.1 代表模型

    知識表示學習的代表模型有距離模型、單層神經網絡模型、雙線性模型、神經張量模型、矩陣分解模型、翻譯模型等。

    2.2 復雜關系模型

    知識庫中的實體關系類型也可分為1-to-1、1-to-N、N-to-1、N-to-N4種類型,而復雜關系主要指的是1-to-N、N-to-1、N-to-N的3種關系類型。

    現在已經從最開始的TransH模型發展到了用高斯分布來刻畫實體與關系的KG2E模型,模型使用高斯分布的均值表示實體或關系在語義空間中的中心位置,協方差則表示實體或關系的不確定度


    3 知識融合

    通過知識提取,實現了從非結構化和半結構化數據中獲取實體、關系以及實體屬性信息的目標。但是由于知識來源廣泛,存在知識質量良莠不齊、來自不同數據源的知識重復、層次結構缺失等問題,所以必須要進行知識的融合。

    3.1 實體對齊

    實體對齊也稱為實體匹配或實體解析或者實體鏈接,主要是用于消除異構數據中實體沖突、指向不明等不一致性問題,可以從頂層創建一個大規模的統一知識庫,從而幫助機器理解多源異質的數據,形成高質量的知識。

    文思海輝(pactera)深耕AI人工智能解決方案在行業的應用領域,專注于AI人工智能技術與行業需求創新結合,賦能客戶與行業,文思海輝以卓越的數字化服務能力深厚的行業積累在AI大數據、AI地產、AI金融、AI客服、AI制造等多領域為全球行業用戶提供AI人工智能創新技術及數字解決方案。


    「真誠贊賞,手留余香」
    您需要登錄后才可以回帖 登錄 | 立即注冊 微信登錄

    本版積分規則

    發表新貼 返回頂部
    幸运农场怎么才能稳赢