漢王影研依托數(shù)字化行業(yè)開(kāi)發(fā)及應(yīng)用經(jīng)驗(yàn),打造全行業(yè)數(shù)字化周邊智能硬件,通過(guò)軟件+硬件的完美結(jié)合,更好的服務(wù)于全行業(yè)數(shù)字化、數(shù)據(jù)化、數(shù)智化的發(fā)展。
伴隨著經(jīng)濟(jì)社會(huì)的快速發(fā)展,人民群眾訴訟需求急劇增加,全國(guó)法院各類(lèi)型案件呈不斷增長(zhǎng)趨勢(shì),案多人少矛盾愈來(lái)愈突出。在案件立案及審理過(guò)程中,每天有大量的紙質(zhì)卷宗產(chǎn)生,其中包含當(dāng)事人提交的立案材料及法院內(nèi)部產(chǎn)生的卷宗材料,隨案同步生成電子卷宗的同時(shí),也增加了編目分類(lèi)的工作量。以北京地區(qū)法院為例,每天掃描紙質(zhì)卷宗達(dá)30萬(wàn)頁(yè),如何減輕電子卷宗掃描及編目人員的工作壓力,提高電子卷宗應(yīng)用效率,成為了智慧法院建設(shè)亟待解決的問(wèn)題。
漢王影研“電子卷宗智能編目系統(tǒng)”融合先進(jìn)的OCR圖文識(shí)別、語(yǔ)義分析、文件切分、機(jī)器學(xué)習(xí)等技術(shù),結(jié)合漢王影研多年積累的行業(yè)大數(shù)據(jù),實(shí)現(xiàn)電子卷宗材料智能命名、文件智能切分、卷宗自動(dòng)編目、卷宗自動(dòng)歸目,為法院行業(yè)自動(dòng)、快速、詳細(xì)、準(zhǔn)確標(biāo)注電子卷宗材料名稱(chēng)及一鍵歸目,方便法官快速定位檢索,可視化利用電子卷宗內(nèi)容,減輕法官團(tuán)隊(duì)隨案同步工作壓力,為法院隨案同步工作開(kāi)展提供技術(shù)支撐,為電子卷宗的深度應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)。
三大核心應(yīng)用
01自動(dòng)分類(lèi)
漢王影研智能編目系統(tǒng),通過(guò)OCR精準(zhǔn)識(shí)別引擎對(duì)電子圖像進(jìn)行全文識(shí)別和信息提取,基于深度學(xué)習(xí)技術(shù),對(duì)卷宗中存在的印刷體、手寫(xiě)體、印刷手寫(xiě)混合、證件、表格等多種形式材料進(jìn)行有效識(shí)別,同時(shí)自適應(yīng)卷宗材料識(shí)別過(guò)程中的干擾因素,對(duì)于材料污損、文字扭曲變形、文字不清晰、復(fù)印底噪、手印、蓋章等干擾因素自動(dòng)規(guī)避,可在材料質(zhì)量不佳的情況下保障識(shí)別準(zhǔn)確率,系統(tǒng)在完成精準(zhǔn)識(shí)別后,按照法官閱卷習(xí)慣和檔案目錄規(guī)范,根據(jù)材料特征值對(duì)同類(lèi)材料分類(lèi)分項(xiàng)。
02自動(dòng)編目
漢王影研智能編目系統(tǒng),可以自動(dòng)將同一份材料的文件合并生成雙層 PDF 文件,提取電子材料中的關(guān)鍵詞統(tǒng)一命名材料,從而完成精準(zhǔn)編目,分類(lèi)結(jié)果以縮略圖+文件名的形式呈現(xiàn)于電腦屏幕上。同時(shí)中心設(shè)置快速人工校驗(yàn)修正環(huán)節(jié),確保編目掛接準(zhǔn)確率達(dá)到 100%,人工修正的結(jié)果會(huì)自動(dòng)反饋到深度學(xué)習(xí)框架,系統(tǒng)通過(guò)對(duì)修正的新樣本進(jìn)行學(xué)習(xí),實(shí)現(xiàn)自我優(yōu)化,進(jìn)一步持續(xù)提升文件拆分及標(biāo)題標(biāo)注準(zhǔn)確率。
03自動(dòng)歸目
漢王影研智能編目系統(tǒng),通過(guò)漢王NLP自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)自動(dòng)、快速、準(zhǔn)確地將電子材料自動(dòng)匹配到對(duì)應(yīng)結(jié)構(gòu)化卷宗目錄下,不需要專(zhuān)門(mén)的人員進(jìn)行拖拽操作,有效解決人工歸目存在分類(lèi)錯(cuò)誤、分類(lèi)不及時(shí)、分類(lèi)信息無(wú)存儲(chǔ)、檢索混亂等問(wèn)題,幫助法官進(jìn)行快速查找、定位檢索、文字復(fù)用等工作,可視化利用電子卷宗內(nèi)容,充分滿(mǎn)足各審判業(yè)務(wù)系統(tǒng)對(duì)卷宗文本內(nèi)容進(jìn)行深度復(fù)用的要求。
我們的優(yōu)勢(shì)
01編目識(shí)別精準(zhǔn)
卷宗文件拆分以及智能命名準(zhǔn)確率達(dá)90%以上。
02編目過(guò)程優(yōu)化
利用深度學(xué)習(xí)技術(shù),系統(tǒng)不斷優(yōu)化編目及歸目準(zhǔn)確率,并持續(xù)擴(kuò)充卷宗類(lèi)型庫(kù)。
03編目類(lèi)型廣泛
當(dāng)事人身份證明材料覆蓋約100+,證據(jù)材料覆蓋約4000+,法院文書(shū)類(lèi)材料覆蓋約2000+。
04編目結(jié)果智能
可根據(jù)法院要求,對(duì)文件進(jìn)行靈活命名,如:身份證,可命名為:江某某-身份證。
結(jié)語(yǔ)
基于漢王云圖OCR圖文識(shí)別、語(yǔ)義分析、文件智能標(biāo)注和切分技術(shù)的漢王影研智能編目系統(tǒng),系統(tǒng)標(biāo)題檢出精確率達(dá)95%、證據(jù)材料分類(lèi)準(zhǔn)確率達(dá)90%、系統(tǒng)整體編目準(zhǔn)確率達(dá)95%,能大大縮減編目時(shí)間和編目工作人員的工作量。采用“人工智能+人工校對(duì)”模式,可使最終卷宗編目數(shù)據(jù)準(zhǔn)確率達(dá)到100%?!半娮泳碜谥悄芫幠肯到y(tǒng)”的應(yīng)用,滿(mǎn)足了卷宗生成自動(dòng)化、智能化、批量化需求,加強(qiáng)了卷宗生成過(guò)程中的技術(shù)融合,提高了法院工作質(zhì)量和效率,讓電子卷宗隨案同步生成和深度應(yīng)用成為可能。