接續前一天,今天要來介紹知識如何表達以及知識圖譜。
知識表達(Knowledge Representation,KR)主要是研究機器要用哪種格式與架構,來儲存與表達「知識的內容」及「知識與知識之間的關係」,以利於電腦程式將來能有效、快速的處理知識的搜索與推理的一種架構工具謂之。
簡單來說就是機器讓知道如何表達知識的意思。
在前一天所提到的法則學派,法則學派有分為兩種研究領域,一是昨天提到的知識推理,代表為專家系統。另一個則是現在所講的知識表達,其代表為知識本體論(Ontology)、語意網路(Semantic Network 與 Semantic Web)以及今天將會提到的知識圖譜。
知識表達學派學者認為,知識數量增加得太快,法則變得太多太複雜,如果對於欲了解的對象沒有一個基本的認識,則法則極可能會產生互相矛盾。因此為了有效處理知識推理,應該要對所要了解的物件擁有更多構造、屬性、關係的認知,才會產生更正確的依據。
由GOOGLE在2012年以知識庫FreeBase為基礎提出了「KG」概念,主要用於搜尋引擎。KG指的是利用節點以邊來表示知識的關係,節點來表示概念或物件的內容,並用屬性、值來描述物件內容邊代表這些概念間的語言關係。簡單來說,知識圖譜類似於我們現在所認知的心智圖。
1.讀入文章
將讀入的文章分割成一個一個的句子。
2.實體存取(Entitiy Extraction)
使用自然語言處理的技術,講句子區分為主要的主詞、動詞、副詞等等提取出來。
3.關係提取(Relationship Extraction)
將實體與實體之間的動詞提出。
4.利用三元組合(Triplet)建構知識圖譜
兩個物件中間用關係連結起來的檔案格式,參考下圖。
結構性
知識圖譜對於資訊內容的描述及概念彼此間的關係,都有一定的結構,有助於知識的儲存以及釐清彼此之間的關係
連結性與成長性
透過內部概念、節點與邊,不斷無限延伸,形成超大型知識庫
成本低
由機器自動讀取及歸納,因此速度快也不需人力成本
自然語言表達
使用自然語言方式來分析語句,架構相較其他叫容易了解
具推理性
具備“本體推理“(Ontology-base Reasoning),例如甲午戰爭締結馬關條約,割讓台灣、澎湖,就能推理出,台灣澎湖是因為甲午戰爭而被割讓的。知識圖譜越大,所能產生的知識量也越多。
1.搜尋引擎上的應用
解決同義字問題:例如搜尋第二次鴉片戰爭,可得知是指英法聯軍。
可直接回答問題:例如搜尋南北戰爭結束時間,會直接出現1865年4月9號。
2.支援QA聊天機器人
透過知識圖譜,可以衍生出許多話題與使用者聊天。
3.支援推理決策
更了解事件的人事時地物之間的關聯,能更深入了解事情面貌。例如醫療上利用病人的病例、使用藥物、診斷內容等等,能更詳細推薦許多治療方案。了解的越多便知道的越多。
參考資料
人工智慧-概念應用與管理 林東清著