Graph + LLM 實踐指南|如何使用自然語言進(jìn)行知識圖譜構(gòu)建和查詢
隨著 ChatGPT 等 AI 智能應(yīng)用在全球范圍內(nèi)的風(fēng)靡,大語言模型技術(shù)(Large Language Model,簡稱 LLM)受到各行業(yè)企業(yè)和個人用戶的廣泛關(guān)注。圖數(shù)據(jù)庫憑借圖形格式組織和連接信息的方式,能夠幫助大語言模型更好地理解實體間的關(guān)系,提升自己的表達(dá)和推理能力。那么,大語言模型與圖技術(shù)在具體應(yīng)用領(lǐng)域又能碰撞出怎樣的火花呢?
經(jīng)過悅數(shù)研發(fā)團(tuán)隊的努力和與國際多家知名大語言模型 LLM 技術(shù)團(tuán)隊的合作,目前悅數(shù)圖數(shù)據(jù)庫的產(chǎn)品已經(jīng)可以實現(xiàn)基于 Graph + LLM 技術(shù)的 Text2Cypher,即自然語言生成圖查詢。用戶只需要在對話界面中通過自然語言就可以輕松實現(xiàn)知識圖譜的構(gòu)建和查詢,更有開箱即用的企業(yè)級服務(wù),歡迎大家在文末點(diǎn)擊試玩體驗新一代的悅數(shù)圖數(shù)據(jù)庫 x 知識圖譜應(yīng)用吧!
作為圖技術(shù)領(lǐng)域最常見應(yīng)用之一,知識圖譜以點(diǎn)-邊形式的圖結(jié)構(gòu)組織和表示知識,不僅可以用于表示實體(如人、地點(diǎn)、事件、概念等)之間的關(guān)系,還包含這些信息之間的語義含義,以一種結(jié)構(gòu)化的方式生動描述現(xiàn)實世界中的知識,使得計算機(jī)能夠理解和推理這些知識,被廣泛應(yīng)用于風(fēng)險控制、生產(chǎn)制造、藥物研發(fā)、科研探索等領(lǐng)域。
顧名思義,Text2Cypher 做的就是把自然語言的文本轉(zhuǎn)換成 Cypher 查詢語句。一直以來,阻礙圖數(shù)據(jù)庫、知識圖譜被更廣泛應(yīng)用的因素之一就是查詢圖數(shù)據(jù)庫的技術(shù)門檻。那么,在沒有大語言模型的時候,我們是怎么做的呢?
傳統(tǒng)的 Text2Cypher
文本到查詢的這個領(lǐng)域在大語言模型之前就一直存在這樣的需求,一直是知識圖譜最常見的應(yīng)用之一,比如 KBQA(基于知識庫的問答系統(tǒng))的系統(tǒng)內(nèi)部本質(zhì)上就是 text2cypher。
當(dāng)一個問題語句發(fā)送過來之后,它首先要做意圖識別(Intent)、實體識別(Entity),然后再利用 NLP 模型或者代碼把相應(yīng)的意圖和實體構(gòu)造成知識圖譜的查詢語句,最終查詢圖數(shù)據(jù)庫,并根據(jù)返回結(jié)構(gòu)構(gòu)造答案。
可以想象,讓程序能夠:
- 從自然語言中理解意圖:對應(yīng)到哪一類支持回答的問題
- 找出實體:問題中涉及到的主要個體
- 從意圖和實體構(gòu)造查詢語句
不可能是一個容易的開發(fā)工作,一個真正能夠落地的實現(xiàn)要訓(xùn)練的模型或者實現(xiàn)的規(guī)則代碼所考慮的邊界條件可能非常多。
大語言模型實現(xiàn)的 Text2Cypher
而在”后大語言模型“時代,這種從前需要專門訓(xùn)練或者寫規(guī)則的”智能“應(yīng)用場景成了通用模型+提示工程(Prompt Engineering)就能完成的任務(wù)。
注:提示工程指通過自然語言描述,讓生成模型、語言模型完成”智能“任務(wù)的方法。
為此,悅數(shù)圖數(shù)據(jù)庫經(jīng)歷了一系列研發(fā)驗證工作,最終實現(xiàn)了大語言模型與圖查詢語言表達(dá)的對接。用戶在提出任務(wù)的時候,只需要使用自然語言,就可以實現(xiàn) Schema 獲取、Cypher 語句生成的 Prompt、各種大語言模型(LLM) 的調(diào)用、結(jié)果的處理,真正實現(xiàn)了無需代碼、開箱即用的知識圖譜構(gòu)建和查詢方案。
通過悅數(shù)圖技術(shù)與大語言模型的結(jié)合,企業(yè)用戶可以輕松實現(xiàn)知識圖譜的構(gòu)建和查詢。不僅可以以較低的費(fèi)用成本完成高準(zhǔn)確性的查找和直觀的可視化呈現(xiàn),而且不再需要長時間的學(xué)習(xí)投入才能掌握從圖中獲取重要洞察的方法了。
和上一代知識圖譜相比,悅數(shù)圖數(shù)據(jù)庫和大模型的結(jié)合,能夠讓企業(yè)以更低成本更便捷地構(gòu)建基于海量數(shù)據(jù)的知識圖譜。同時,用戶能直接使用自然語言進(jìn)行交互式提問和查詢,降低企業(yè)使用門檻,用戶學(xué)習(xí)成本更低。
[免責(zé)聲明]
原文標(biāo)題: Graph + LLM 實踐指南|如何使用自然語言進(jìn)行知識圖譜構(gòu)建和查詢
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評;未經(jīng)許可,禁止轉(zhuǎn)載。



