華宇材料識别系統是基于深度學(xué)習的AI引擎,利用圖像OCR、基于深度學(xué)習的圖像分類和目标檢測、實體識别等技術,針對(duì)卷宗等材料實現智能(néng)識别分析,使卷宗材料具有更好(hǎo)的利用價值。華宇卷宗識别引擎具有4大模塊(10大核心能(néng)力):材料類型識别、材料内容識别、材料優化治理、材料關系判定。
1. 對(duì)卷宗材料進(jìn)行分析并輸出材料的類型、材料的屬性及材料的标題等信息,爲上層應用提供底層支撐。目前積累了近4000種(zhǒng)材料類型的識别,基本可以覆蓋公檢法司常見材料類型(法律文書、審批表單、制式文件),也支持對(duì)證據材料及偵查過(guò)程中涉及的通用材料(卡片證照、表單票據、網絡圖片、場景、人、物品)進(jìn)行識别。
2. 通過(guò)對(duì)材料内容的設定,并對(duì)大量材料的标注、特征抽取、訓練,在感知層實現對(duì)圖像特征信息的識别和定位,對(duì)材料整體内容進(jìn)行分析并識别,將(jiāng)識别的結果反饋給上層應用。目前支持對(duì)結構化信息、指紋、印章、二維碼、頭像、手寫簽名等内容進(jìn)行識别,并可根據需要設定識别模闆,不斷豐富支持的材料種(zhǒng)類及材料的内容。
3. 材料優化治理利用邊緣檢測法、虛化檢測法等技術,對(duì)卷宗中黑邊嚴重、空白頁、圖片歪斜、像素低下、圖片模糊不聚焦等圖片效果不好(hǎo)的材料,進(jìn)行優化處理,提高材料的可利用性。
目前材料類型覆蓋4000餘垂類材料類型。
優化材料質量後(hòu)對(duì)材料命名并對(duì)材料中的目标信息,結構化信息精準提取,提升實體材料的應用價值。
支持多種(zhǒng)模闆定制,可根據實際情況配置,滿足多樣(yàng)化需求,覆蓋更多的場景。
學(xué)習能(néng)力的提升和性能(néng)不斷提升,反饋結果速率及準确率不斷攀升。