
9月26日,由中國(guó)科技部、中國(guó)科學(xué)院、北京市人民政府共同主辦的中關(guān)村論壇國(guó)際技術(shù)交易大會(huì)召開,易道博識(shí)在新技術(shù)新產(chǎn)品首發(fā)大會(huì)上正式首發(fā)移動(dòng)端深度學(xué)習(xí)OCR產(chǎn)品DOM,易道博識(shí)聯(lián)合創(chuàng)始人兼CTO康鐵鋼做首發(fā)演講。

2021中關(guān)村論壇以“智慧·健康·碳中和”為年度主題,重點(diǎn)發(fā)布一批國(guó)家級(jí)創(chuàng)新成果,最新的科技政策,會(huì)期5天,重點(diǎn)圍繞論壇會(huì)議、展覽展示、成果發(fā)布、技術(shù)交易等6大板塊,同時(shí)舉辦新技術(shù)新產(chǎn)品首發(fā)大會(huì)等貫穿全年的常態(tài)化系列活動(dòng),聚焦國(guó)內(nèi)外最有影響力的新技術(shù)和新產(chǎn)品。
作為中關(guān)村論壇的重要組成部分,中關(guān)村國(guó)際技術(shù)交易大會(huì)探索建設(shè)具有全球影響力的科技成果轉(zhuǎn)化和技術(shù)交易高地。此次,能在面向全球科技創(chuàng)新交流合作的國(guó)家級(jí)平臺(tái)做產(chǎn)品首發(fā),代表了政府對(duì)易道博識(shí)的技術(shù)創(chuàng)新力、產(chǎn)品持續(xù)服務(wù)價(jià)值的高度認(rèn)可。
不依賴算力,手機(jī)實(shí)現(xiàn)服務(wù)器級(jí)的證件識(shí)別
當(dāng)前,大量的OCR應(yīng)用需要在資源受限的移動(dòng)端設(shè)備上運(yùn)行,當(dāng)前移動(dòng)端OCR算法大多以犧牲一定的算法精度來(lái)?yè)Q取運(yùn)行速度,針對(duì)移動(dòng)設(shè)備設(shè)計(jì)兼顧性能和效率的輕量OCR模型將是未來(lái)發(fā)展的重要方向。
“ Deep OCR for Mobile(DOM),是一款可以在移動(dòng)端實(shí)現(xiàn)深度學(xué)習(xí)的OCR產(chǎn)品,可以支持在任意方向或角度以及苛刻背景條件下的超高速證件識(shí)別。DOM最大的特點(diǎn)體現(xiàn)在兩方面:高精度,輕量級(jí)。他可以10M左右的內(nèi)存環(huán)境,在保證高精度的前提下,深度學(xué)習(xí)的高速度優(yōu)勢(shì)完美展現(xiàn)。”康鐵鋼在演講中介紹道。
“另外,DOM實(shí)現(xiàn)了原來(lái)只有在服務(wù)器端才能完全實(shí)現(xiàn)的證件質(zhì)檢功能,針對(duì)模糊、變形等異常情況進(jìn)行檢測(cè)提示,以及營(yíng)業(yè)執(zhí)照等大幅面紙質(zhì)憑證的快速識(shí)別,在此之前,這些功能是沒法在移動(dòng)端完全實(shí)現(xiàn)的。”
相比傳統(tǒng) SDK 中基于四邊定位的的方法,深度學(xué)習(xí)的方法能夠更好地排除 背景噪聲的干擾,如存在背景線條或背景特征與證件接近的情況,從而可以得到更精確的證件輪廓信息。
具體而言,在識(shí)別能力上,相比于傳統(tǒng)的 OCR 方法,基于深度學(xué)習(xí)技術(shù)的 DOM SDK識(shí)別核心具有大幅度領(lǐng)先的識(shí)別精度,具體表現(xiàn)在如生僻字、少數(shù)民族證件等場(chǎng)景下更好的識(shí)別效果。
“DOM SDK的市場(chǎng)需求非常大,證券開戶,銀行開戶,投保理賠,汽車金融……等大量應(yīng)用卡證識(shí)別,且移動(dòng)端需求量極大的業(yè)務(wù),都是DOM SDK的應(yīng)用場(chǎng)景。這些場(chǎng)景對(duì)識(shí)別速度、識(shí)別精度的要求非常高,客戶容忍度低,注重用戶體驗(yàn),對(duì)產(chǎn)品的魯棒性要求很高。”
目前,DOM SDK支持身份證、銀行卡、港澳臺(tái)身份證,臨時(shí)身份證、港澳臺(tái)居民往來(lái)內(nèi)地通行證、外國(guó)人永久居留身份證、營(yíng)業(yè)執(zhí)照以及護(hù)照識(shí)別,幾乎涵蓋了移動(dòng)端需要的所有證件的識(shí)別支持。
擁抱深度學(xué)習(xí),讓AI真正實(shí)現(xiàn)降本增效
與人臉識(shí)別等其它識(shí)別任務(wù)不同,OCR技術(shù)不僅需要卷積神經(jīng)網(wǎng)絡(luò)(CNN),還需要更復(fù)雜、計(jì)算量更大的遞歸神經(jīng)網(wǎng)絡(luò)(RNN、LSTM),這需要強(qiáng)大算力為支撐,而手機(jī)并不像服務(wù)器端一樣擁有GPU。在不依賴算力和GPU的情況下,大幅度提升識(shí)別精度,顯著改善用戶體驗(yàn),這正是DOM SDK的技術(shù)價(jià)值所在。
易道博識(shí)認(rèn)為,AI的本質(zhì)是生產(chǎn)力,體現(xiàn)在行業(yè)場(chǎng)景中就是降本增效。一直以來(lái),易道博識(shí)也一直在為多個(gè)行業(yè)量身定制智能解決方案,驅(qū)動(dòng)行業(yè)實(shí)現(xiàn)跨越式智能升級(jí)。
迄今為止,易道博識(shí)已經(jīng)成為金融領(lǐng)域合作覆蓋范圍最廣、方案最成熟、識(shí)別產(chǎn)品最豐富的人工智能企業(yè)之一,與七成以上的券商都有合作。易道博識(shí)提供的OCR識(shí)別+人臉識(shí)別相結(jié)合的非現(xiàn)場(chǎng)開戶智能方案在證券、銀行、保險(xiǎn)等行業(yè)內(nèi)廣泛應(yīng)用。
未來(lái),易道博識(shí)將繼續(xù)發(fā)揮技術(shù)優(yōu)勢(shì),不斷致力于人工智能領(lǐng)域的技術(shù)研究與應(yīng)用開發(fā),圍繞文字識(shí)別、人臉識(shí)別、圖像識(shí)別三大核心技術(shù),更好地在行業(yè)沉淀上持續(xù)自我升級(jí),專注地服務(wù)每一個(gè)客戶,認(rèn)真解決客戶遇到的每一個(gè)問題。