IDP智能文檔審閱系統,業內首家全內容關鍵信息抽取產品

噠噠
關注
2022-07-19 17:19
896次閱讀
市面上的招股說明書,動輒三四百頁,關鍵的發行人信息、財務信息、股權結構圖,如何快速查找?券商研究報告,幾十頁上百頁,核心圖表、數字、觀點如何有效獲取?合同中,關鍵條款如何快速定位?在信息過載時代基于市面的需求,達觀數據自主研發的智能文檔審閱(IDP)系統能從幾百頁的長文檔中智能提取實體、關系級別信息,也能提取關鍵圖表、段落、章節等文檔要素級別信息,可百倍提升閱讀效率。
達觀的智能文檔審閱(IDP)系統如何做到支持全內容提取:
一、達觀擁有強大的自研文檔標注功能
- (1) 支持文字劃選、框選、表格內容一鍵標注;
- (2) 支持圖片、表格框選;
(3) 支持表格增刪線條、合并/拆分單元格等多種操作;
- (4) 支持字段組合標注;
二、 依靠達觀的獨家版面還原技術
- (1) 可還原文件的頁眉頁腳、圖、表、標題、段落、目錄等版面信息。
- (2) 支持對還原結果進行編輯,包括修改文字和表格結果。
- (3) 支持直接導出文字內容、圖片、表格結果。
- (4) 支持API對接輸入,為后續信息提取提供底層技術能力。
版面還原示例圖
三、達觀自有模型訓練平臺,完成AI自動提取
達觀基于NLP、深度學習技術,提供了強大易用的模型訓練平臺。
- (1)在系統中內置多種算法,可針對不同的抽取關鍵字選擇不同的算法,模型參數可動態調整。
- (2) 元素抽取算法可以支持抽取如段落,圖片,表格等內容。
- (3) 同時支持模型導入導出,可在不同場景下進行模型的遷移。支持現有模型增量訓練,大幅提升訓練效率
內置多種算法
招股書抽取模型示例
私募基金合同抽取模型示例
據了解達觀數據的全內容關鍵信息提取產品,已在某交易所、頭部券商研究所、頭部券商托管部門部署應用,結合行業多年經驗積累,已形成招股說明書提取、研究報告審核、私募基金合同提取等多個開箱即用模型。未來將持續積累,為客戶數字化智能化轉型、工作效率提升提供利器。
開箱即用模型示例

噠噠
+
關注
0