亚洲精品无码a人观看,国产精品综合亚洲AV,精品国产成人AV在线,亚洲av无码不卡久久

400-690-0167
【影研之家】圖文慧眼金睛,基于AI技術(shù)的新一代智能引擎
2022-12-01

現(xiàn)階段的無(wú)紙化辦公,首先需要依托于PC和移動(dòng)設(shè)備,一份紙質(zhì)材料要想實(shí)現(xiàn)在PC、移動(dòng)端的數(shù)據(jù)分析應(yīng)用,首先需要對(duì)紙質(zhì)材料進(jìn)行數(shù)字化加工,目前通常利用高拍儀、掃描儀等采集設(shè)備進(jìn)行影像材料生成,接下來(lái)會(huì)對(duì)生成的圖片進(jìn)行OCR文字識(shí)別形成文本數(shù)據(jù),再接著需要對(duì)文本進(jìn)行要素抽取,形成結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行存儲(chǔ),最后將結(jié)構(gòu)化數(shù)據(jù)提供給業(yè)務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)分析和利用。



在將生成的圖片轉(zhuǎn)換形成文本數(shù)據(jù)這一環(huán)節(jié),需利用OCR技術(shù)進(jìn)行圖文識(shí)別,但由于紙質(zhì)文檔的形態(tài)越來(lái)越復(fù)雜化、多樣化,低抗噪、小樣本、單一字體的傳統(tǒng)OCR已無(wú)法滿足文檔“多樣性”的識(shí)別及利用需求。


另一方面,從用戶采購(gòu)利用的角度來(lái)說(shuō),傳統(tǒng)的OCR多以SDK形式提供給軟件應(yīng)用開(kāi)發(fā)商做二次開(kāi)發(fā)利用,識(shí)別能力與應(yīng)用系統(tǒng)綁定,需要為多個(gè)系統(tǒng)提供識(shí)別服務(wù)時(shí),通常需要多次采購(gòu)、部署、對(duì)接;識(shí)別服務(wù)也多以后臺(tái)方式運(yùn)行,能力使用情況無(wú)法實(shí)時(shí)掌握,數(shù)據(jù)無(wú)法實(shí)時(shí)分析,出現(xiàn)問(wèn)題無(wú)法及時(shí)排查。因此,業(yè)務(wù)應(yīng)用上亟需一款集約、穩(wěn)定、準(zhǔn)確的OCR圖文識(shí)別能力引擎。


漢王影研圖文識(shí)別能力引擎正是基于以上需求痛點(diǎn)專門打造,引擎具備以下三大特點(diǎn):

一是安全無(wú)憂:完全在內(nèi)網(wǎng)或政務(wù)專網(wǎng)內(nèi)部署,數(shù)據(jù)不外漏,保證信息安全;

二是快速靈動(dòng):采用新一代云計(jì)算架構(gòu),支持高并發(fā),成熟穩(wěn)定,易于整合,面對(duì)海量數(shù)據(jù)也能快速靈動(dòng);

三是精準(zhǔn)可靠:基于AI機(jī)器學(xué)習(xí)、深度學(xué)習(xí)技術(shù),包含文字識(shí)別、圖像識(shí)別、圖像處理、材料識(shí)別、文本解析抽取等功能,識(shí)別處理解析準(zhǔn)確率高、速度快。


漢王影研圖文識(shí)別能力引擎從功能上圍繞電子卷宗、電子檔案、電子文件同步生成、深度應(yīng)用等應(yīng)用場(chǎng)景專門打造。引擎包含12項(xiàng)能力組合,不僅僅是文字識(shí)別,還涉及CV圖像處理、OCR文字識(shí)別、NLP自然語(yǔ)言處理技術(shù),并利用海量行業(yè)數(shù)據(jù)進(jìn)行深度學(xué)習(xí),生成模型后不斷優(yōu)化應(yīng)用。



一、產(chǎn)品功能


1、精準(zhǔn)識(shí)別


印刷體文字識(shí)別:識(shí)別準(zhǔn)確率高達(dá)99%;

手寫體文字識(shí)別:識(shí)別準(zhǔn)確率高達(dá)95%,高于人眼辨認(rèn);

表格識(shí)別:可將表格線精準(zhǔn)還原,一鍵導(dǎo)出EXCEL;

證件識(shí)別:支持20+類常見(jiàn)個(gè)人企事業(yè)證件材料;

圖像元素檢出:支持印章、手印、簽字、圖片、國(guó)徽、人像、條碼、二維碼等10+類元素檢出。


2、優(yōu)化閱覽

漢王影研圖文識(shí)別能力引擎支持雙層PDF合成/雙層OFD合成,自由復(fù)制文本復(fù)用;版式精準(zhǔn)還原,段落版式1:1精確還原;圖像智能處理,“臟圖”智能過(guò)濾、無(wú)懼干擾;材料自動(dòng)命名分類,支持文件切分、標(biāo)題提取、文本規(guī)則匹配。


3、要素抽取

漢王影研圖文識(shí)別能力引擎支持NLP結(jié)構(gòu)化、半結(jié)構(gòu)化要素抽取,包含文本內(nèi)容要素抽取、表格要素抽取、卡證要素抽取。


二、優(yōu)勢(shì)亮點(diǎn)


漢王影研圖文識(shí)別能力引擎基于新一代云計(jì)算架構(gòu)設(shè)計(jì),可為工作內(nèi)網(wǎng)、涉密專網(wǎng)、互聯(lián)網(wǎng)24小時(shí)提供AI識(shí)別能力。采用微服務(wù)架構(gòu),快速靈便,業(yè)務(wù)應(yīng)用可根據(jù)不同場(chǎng)景進(jìn)行識(shí)別服務(wù)的API調(diào)用;提供日志記錄、權(quán)限控制、可視化監(jiān)控,實(shí)時(shí)查看能力應(yīng)用狀況;可部署在政務(wù)云、公有云、工作內(nèi)網(wǎng)獨(dú)立服務(wù)器,基于Docker和k8s部署,提供負(fù)載均衡,支持彈性擴(kuò)展,實(shí)現(xiàn)一次建設(shè)、多系統(tǒng)調(diào)用,避免資源建設(shè)浪費(fèi)。


1、識(shí)別干擾自適應(yīng)

針對(duì)表格、混排等復(fù)雜版面,版面污損,自有手寫,扭曲形變,文字劃線涂抹,指印扣章,帶有底灰底紋的復(fù)印證照噪聲干擾情況,引擎利用海量臟圖進(jìn)行深度學(xué)習(xí),識(shí)別效果絲毫不受干擾,不影響識(shí)別的準(zhǔn)確率。


2、快速優(yōu)化提升

引擎基于機(jī)器學(xué)習(xí)技術(shù),可結(jié)合不同行業(yè)的業(yè)務(wù)數(shù)據(jù)進(jìn)行訓(xùn)練,具體的訓(xùn)練流程為:

獲取文檔材料→進(jìn)行樣本標(biāo)注→生成深度學(xué)習(xí)算法模型→大規(guī)模算法迭代→引擎服務(wù)化→上線部署→人機(jī)耦合→循環(huán)標(biāo)注,最終達(dá)到持續(xù)優(yōu)化的目的。

可在線搭建深度學(xué)習(xí)流水線,不斷自我完善,成為活化的圖文識(shí)別引擎。


3、識(shí)別速度快

引擎基于常規(guī)GPU服務(wù)器配置,整機(jī)識(shí)別吞吐率可達(dá)10張/秒,可根據(jù)實(shí)際業(yè)務(wù)并發(fā)需求進(jìn)行彈性擴(kuò)展,支撐批量化、實(shí)時(shí)同步調(diào)用需求。


4、支持多種部署平臺(tái)

引擎支持X86平臺(tái)部署,同時(shí)支持國(guó)產(chǎn)化平臺(tái)部署,支持飛騰+寒武紀(jì)、鯤鵬+Atlas300、海光+寒武紀(jì)多種國(guó)產(chǎn)化硬件計(jì)算資源,支持國(guó)家信息化應(yīng)用創(chuàng)新戰(zhàn)略。


5、支持多生態(tài)適配

截至目前,漢王圖文識(shí)別能力引擎經(jīng)過(guò)統(tǒng)信、麒麟、華為、達(dá)夢(mèng)、東方通嚴(yán)格的兼容性功能測(cè)試、性能測(cè)試及安全測(cè)試,圖文識(shí)別能力引擎滿足測(cè)試要求,成功與統(tǒng)信服務(wù)器操作系統(tǒng)、銀河麒麟高級(jí)服務(wù)器操作系統(tǒng)、華為鯤鵬&昇騰芯片、武漢達(dá)夢(mèng)數(shù)據(jù)庫(kù)、東方通中間件完成國(guó)產(chǎn)化適配認(rèn)證,并取得兼容性認(rèn)證證書??筛鶕?jù)不同項(xiàng)目要求進(jìn)行快速適配,提供更完善的信創(chuàng)圖文識(shí)別生態(tài)。


漢王影研始終堅(jiān)持以用戶為核心,以OCR識(shí)別、NLP自然語(yǔ)言處理等核心技術(shù)為手段,通過(guò)對(duì)用戶需求的不斷探索,實(shí)現(xiàn)技術(shù)、產(chǎn)品的迭代升級(jí)。在安全、高效提升圖文識(shí)別質(zhì)效的同時(shí),響應(yīng)國(guó)家“雙碳”戰(zhàn)略目標(biāo)和綠色環(huán)保的理念,提升“青山”顏值,做大“銀山”價(jià)值,實(shí)現(xiàn)綠色高質(zhì)量發(fā)展,漢王影研將與合作伙伴一起迎接美好的綠色發(fā)展未來(lái)。



原文鏈接:https://mp.weixin.qq.com/s/1RVsNWoBXW3qtDtQQUK-eA