易道博識(shi)掌握具有自主(zhu)知識(shi)產權的(de)核(he)心算法,覆蓋文字識(shi)別、文檔處(chu)理、圖像處(chu)理、自然語言處(chu)理,結(jie)合領域模(mo)(mo)型(xing)學習能(neng)力(li),駕馭算力(li)資源,不(bu)斷實現數據驅動下的(de)模(mo)(mo)型(xing)升級,持(chi)續(xu)打造更(geng)強大(da)的(de)AI能(neng)力(li)。
文字識別
表格識別
印章識別
勾選識別
簽名比對
印刷、手寫、中文、英文、數字識別
基于深度學習全新DeepOCR識別流程,大幅提升識別速度及精度,
卡證類< 300ms,單張發票< 1s,A4幅面票據混掃< 3s,
漢字字符識別率> 99.5%,數字字符識別率> 99.9%,
英文字符(fu)識別(bie)率(lv)> 99.7%,手寫整行識別(bie)率(lv)> 95.2%
有線(xian)、無線(xian)、列位偏移、多列重疊
多形狀、多方向、曲線行、模糊、遮擋
重疊 、小印章
符號檢測、內(nei)容識別
簽(qian)名檢測、簽(qian)名比對
版面分析:標題、段落、表格、印章、簽名、信息塊、圖表
文檔分類:固定格式、非固定格式、富格式文檔、長文本文檔
文檔抽取:實體、關系、表格、印章、簽名
文(wen)檔比對:關鍵信(xin)息、段落、表格、結(jie)構
圖像檢測、圖像分割
圖像質檢:模糊、反光、拍屏、水印、復印、篡改、變形、切邊、遠距離、遮擋
噪(zao)聲和干(gan)擾去除:圖像噪(zao)聲、水印、陰影、印章、痕跡(ji)去除
文本分析:分詞、詞向量表示、依存句法分析、命名體識別、文本相似度
語言理解(jie):文本分類、信(xin)息抽取、情感分析
依托GPT、BERT等(deng)大規模語(yu)言模型(xing),基于海量文(wen)本語(yu)料自動學(xue)習,具備更好的文(wen)本理解和文(wen)本生成能力。
基于LayoutLM、ERNIE等大規模文(wen)檔版式預訓(xun)練模型,利用大量文(wen)檔樣(yang)本自監督(du)學習,更好地理解各種文(wen)檔結構、內(nei)容和語義(yi)。
以大規模(mo)(mo)語言模(mo)(mo)型(xing)(xing)和版(ban)式(shi)預(yu)訓練模(mo)(mo)型(xing)(xing)為基(ji)礎結合領域數(shu)據(ju),通過下游任務(wu)學習,快速生成領域中(zhong)小規模(mo)(mo)模(mo)(mo)型(xing)(xing),并輸出場景AI能力。
針對本(ben)地化(hua)、私有化(hua)等(deng)生產部署場景(jing),利(li)用知識蒸餾等(deng)模型輕量化(hua)技術,解決算(suan)力局限性問題(ti)實現業(ye)務場景(jing)深(shen)度融合(he)。