日本免费A级毛一片_99久久综合狠狠综合久久_成年女人色毛片_亚洲av午夜福利精品一区二区

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公司新聞

以數據驅動模型,可訓練、可現場應用的賽博學習平臺

來源:易道博識 發布時間:2022-11-18

日(ri)前,由江蘇(su)省支付清算(suan)服(fu)務協會(hui)、山(shan)東省支付清算(suan)協會(hui)支持的(de)(de)(de)2022金融科技創(chuang)新發展論(lun)壇(tan)在(zai)遵義成功召開。易道博識CTO康鐵鋼(gang)先生受邀參會(hui),與來(lai)自(zi)銀行(xing)、保險、證(zheng)券(quan)等(deng)行(xing)業的(de)(de)(de)100余(yu)位(wei)行(xing)業專家,分享以數(shu)據驅動模型,可訓練、可現(xian)場應用的(de)(de)(de)賽博深度學習(xi)平(ping)臺在(zai)行(xing)業中(zhong)的(de)(de)(de)應用創(chuang)新。



行業痛點繁多,長尾(wei)憑(ping)證痛點難(nan)除


隨(sui)著(zhu)金融業(ye)務(wu)的發展,越(yue)來越(yue)多的業(ye)務(wu)線中涉(she)及的紙質(zhi)憑證影像需要用到(dao)OCR自動(dong)處理,來進一(yi)步(bu)提升業(ye)務(wu)辦理的效率(lv)。從企業內部的(de)數據類型來看(kan),這些憑(ping)證(zheng)影像按照格(ge)式可以分為(wei)兩類:一(yi)類是(shi)固定格(ge)式的(de)(de)憑(ping)證(zheng)(戶口本、港澳臺身份證(zheng)、外國(guo)人永久(jiu)居(ju)留證(zheng)等),占整體(ti)90%以上;一(yi)類是(shi)非固定格(ge)式的(de)(de)憑(ping)證(zheng)(銀行(xing)流水(shui)等)。這些(xie)憑證存在以下特(te)點(dian):

1、種類多(duo):內在(zai)各個業務受(shou)理過程中涉及到的憑證都在(zai)百種(zhong)以(yi)上,甚(shen)至(zhi)多達(da)幾百種(zhong);

2、更新頻繁:不少憑證(zheng)會隨(sui)著業務需(xu)求或(huo)者監管制度的變化而調整格式(shi);

3、長尾憑(ping)證(zheng)“雞肋”:存(cun)在很多使用頻率低,但總體數量大(da)的(de)憑證(zheng),這些憑證(zheng)單獨采購識別(bie)的(de)價值不(bu)大(da)但又無法解決;

4、數據(ju)安全:大多數情況(kuang)下,隱私(si)數據是無法對(dui)外(wai)的,如何(he)在這(zhe)種情況(kuang)下做模型訓(xun)練是客觀需要面對(dui)的問題;


基于此類特點,對憑證的OCR識別工作就特別復雜。目前針對與此的解決方案都各有缺陷:要(yao)么持續投入高,需要(yao)廠(chang)商(shang)就每(mei)一種(zhong)憑證進行定制化開(kai)發,要(yao)么需要(yao)采購廠(chang)商(shang)底層能力,而且需要(yao)OCR專(zhuan)家(jia)團隊的支持,投入成(cheng)本(ben)更高。因此,行(xing)業迫切需要一個能夠減少后續投入,自主可控的解決方案。


自我數據閉環,賽博自成有機整體


賽博學習(xi)平臺(tai)(tai)是易道博識基于深度學習(xi)自主研發的一站式機器(qi)學習(xi)訓練平臺(tai)(tai)。賽(sai)博平(ping)臺集數據管理、數據標注(zhu)、模型訓練(lian)和模型應(ying)用于一身(shen),提(ti)供及時、現(xian)場(chang)化的數據驅(qu)動模型應(ying)用解決方案。



論壇上,易道博識CTO康(kang)鐵鋼介紹道:“賽博平(ping)臺充(chong)分(fen)利(li)(li)用了現(xian)有的(de)經過長期(qi)迭代(dai)的(de)基(ji)礎(chu)模(mo)型(xing)(xing)(xing)能力,包括圖(tu)像(xiang)、OCR和(he)NLP等,在少(shao)量樣(yang)本的(de)驅動下,利(li)(li)用遷(qian)移(yi)學(xue)習和(he)小樣(yang)本學(xue)習等技術,高效地完成增量模(mo)型(xing)(xing)(xing)的(de)訓練,生(sheng)成最優的(de)模(mo)型(xing)(xing)(xing)文件(jian),并通過推理平(ping)臺來實現(xian)模(mo)型(xing)(xing)(xing)的(de)快速部署(shu)與生(sheng)產應用。


產(chan)品(pin)組成上,賽(sai)博平(ping)(ping)臺由管(guan)理(li)中心(xin)CyberCenter、數據標注平(ping)(ping)臺 CyberData、深度(du)(du)學(xue)習(xi)訓(xun)練(lian)平(ping)(ping)臺 CyberLearning和(he)深度(du)(du)學(xue)習(xi)推理(li)平(ping)(ping)臺 CyberServing幾個子(zi)平(ping)(ping)臺組成,各子(zi)平(ping)(ping)臺依次承擔平(ping)(ping)臺管(guan)理(li)、數據管(guan)理(li)與標注、模(mo)型訓(xun)練(lian)和(he)模(mo)型服務的功能,個(ge)子(zi)平(ping)臺之間相互獨立(li)又有(you)(you)效配(pei)合,形成一(yi)個(ge)有(you)(you)機整(zheng)(zheng)體(ti),從(cong)而有(you)(you)效支撐數據驅動模型應用的整(zheng)(zheng)體(ti)功(gong)能(neng)。


數(shu)據標注平臺 CyberData


數據(ju)(ju)(ju)(ju)平臺(tai)主要功能(neng)包括數據(ju)(ju)(ju)(ju)管理(li)、數據(ju)(ju)(ju)(ju)處理(li)、樣本擴充、數據(ju)(ju)(ju)(ju)標(biao)注(zhu)(zhu)與采集(ji)。數據(ju)(ju)(ju)(ju)平臺(tai)內置(zhi)exLabeler標(biao)注(zhu)(zhu)客戶端,提供(gong)強大專業(ye)的CV、OCR、結(jie)構化(hua)和NLP任務標(biao)注(zhu)(zhu)功能(neng)。同時,數據(ju)(ju)(ju)(ju)平臺(tai)還支持單(dan)人和團隊標(biao)注(zhu)(zhu)模(mo)式。


用(yong)戶(hu)可以通(tong)過(guo)exLabeler客戶(hu)端完成樣本(ben)的(de)標注(zhu)。exLabeler支持CV、OCR、結構化和NLP等(deng)領域算法的(de)標注(zhu)。標注(zhu)完成的(de)數據集可以直(zhi)接用(yong)于(yu)模型訓練,或(huo)進一步做后處(chu)理(如(ru)圖像處(chu)理、樣本(ben)擴充(chong)等(deng)),然后再用(yong)于(yu)模型訓練。


數據(ju)標注平臺(tai) CyberData工作(zuo)流程


深度學習訓練平臺 CyberLearning


訓練(lian)平(ping)(ping)臺通過自(zi)身(shen)對于(yu)訓練(lian)資(zi)源池的集中管(guan)理(li)與分配,以(yi)及與管(guan)理(li)平(ping)(ping)臺的無縫對接,可(ke)以(yi)方便地實現訓練(lian)基礎設(she)施(shi)的管(guan)理(li),從而減(jian)輕(qing)用戶的管(guan)理(li)維護(hu)工作。同(tong)時(shi),利用自(zi)動超(chao)參搜索等技術,訓練(lian)平(ping)(ping)臺可(ke)以(yi)自(zi)動搜索到最(zui)佳性能的模型。


通過(guo)分布(bu)式(shi)訓(xun)練(lian)(lian)與多框架支持(chi),訓(xun)練(lian)(lian)平臺(tai)(tai)可以最(zui)(zui)大化(hua)利(li)用(yong)計算資源,加速模型(xing)訓(xun)練(lian)(lian)。同時,利(li)用(yong)自動超參搜索等技術,訓(xun)練(lian)(lian)平臺(tai)(tai)可以自動搜索到(dao)最(zui)(zui)佳(jia)性能的(de)(de)模型(xing)。最(zui)(zui)后,對于訓(xun)練(lian)(lian)所(suo)得的(de)(de)最(zui)(zui)優模型(xing),訓(xun)練(lian)(lian)平臺(tai)(tai)支持(chi)一鍵部署到(dao)推(tui)理平臺(tai)(tai),實(shi)現模型(xing)的(de)(de)快速應用(yong)。


深度(du)學習訓練平臺 CyberLearning工作流程



深度(du)學習推理(li)平(ping)臺 CyberServing


推(tui)理(li)(li)平(ping)(ping)臺(tai)(tai)主要完(wan)成各種(zhong)識別(bie)功能的部署。業(ye)務系統通過(guo)調用(yong)推(tui)理(li)(li)平(ping)(ping)臺(tai)(tai)提(ti)供的RESTful API提(ti)交圖(tu)像并獲(huo)得(de)識別(bie)結果。整體上講,推(tui)理(li)(li)平(ping)(ping)臺(tai)(tai)產(chan)品(pin)需求可分解為模型管(guan)(guan)理(li)(li)、API過(guo)程定義、識別(bie)數(shu)據查看,接口統計和其(qi)它非功能項等部分。其(qi)中模型管(guan)(guan)理(li)(li)和API管(guan)(guan)理(li)(li)模塊屬于基礎核(he)心模塊。


推(tui)理(li)平(ping)(ping)臺對同(tong)一(yi)模(mo)型(xing)(xing)不同(tong)版(ban)(ban)本的管(guan)理(li),并支持(chi)在模(mo)型(xing)(xing)服(fu)(fu)務中(zhong)同(tong)時加載(zai)和(he)運行多(duo)個版(ban)(ban)本的模(mo)型(xing)(xing)。推(tui)理(li)平(ping)(ping)臺還支持(chi)一(yi)個API綁定多(duo)個模(mo)型(xing)(xing)服(fu)(fu)務。模(mo)型(xing)(xing)升級(ji)時,用戶(hu)可以(yi)選擇先在部分服(fu)(fu)務中(zhong)激(ji)活(huo)新版(ban)(ban)本的模(mo)型(xing)(xing),完成測試驗(yan)證(zheng)后再升級(ji)其他服(fu)(fu)務。


深度(du)學(xue)習推(tui)理(li)平(ping)臺 CyberServing工作流(liu)程


值得(de)一(yi)提的(de)是,賽(sai)博平(ping)臺(tai)(tai)打(da)造了數(shu)據(ju)驅動模型應用的(de)閉環。推(tui)理平(ping)臺(tai)(tai)支持對(dui)于(yu)自身(shen)所產生(sheng)的(de)生(sheng)產數(shu)據(ju)根據(ju)不(bu)同(tong)的(de)條(tiao)件(jian)進行自動采(cai)集(ji)(ji)的(de)功能,采(cai)集(ji)(ji)后(hou)的(de)數(shu)據(ju)可(ke)以方便地(di)導(dao)入標注平(ping)臺(tai)(tai),形成數(shu)據(ju)集(ji)(ji),并支持進一(yi)步的(de)數(shu)據(ju)處(chu)理與標注。標注完(wan)成的(de)數(shu)據(ju)集(ji)(ji)可(ke)以用于(yu)模型的(de)訓練調優,從而得(de)到(dao)性能更(geng)佳的(de)模型,用于(yu)更(geng)新推(tui)理平(ping)臺(tai)(tai)生(sheng)產模型,從而形成一(yi)個完(wan)整的(de)數(shu)據(ju)閉環。


《國民經濟和(he)社會發(fa)展第十四個五年規(gui)(gui)劃和(he)2035年遠景(jing)目標綱要》提出(chu)加快(kuai)數字(zi)化(hua)發(fa)展,人民銀(yin)行《金(jin)融科技發(fa)展規(gui)(gui)劃(2022-2025)》中明確了“十四五”期間行業(ye)金(jin)融科技發(fa)展、數字(zi)化(hua)轉型目標,要從治理體系(xi)、業(ye)務(wu)創(chuang)新、技術和(he)數據(ju)能力建設、風險(xian)防范(fan)等多(duo)維度提出(chu)重點任務(wu),推動行業(ye)數字(zi)化(hua)轉型落地實(shi)施。


如(ru)今,AI產業正逐步進(jin)入低技術門檻、低部署成(cheng)本、各產業深度參與(yu)雙向共建的(de)效率(lv)化生產階段。而作為支撐AI模(mo)型開(kai)發及落地(di)的(de)資源型平臺,賽(sai)博平臺可在多方(fang)面提(ti)升AI技術價值(zhi)釋放。從(cong)總體上(shang)看,賽博平臺可(ke)提供較為前(qian)沿的(de)技(ji)術、符合業務場景的(de)模型生(sheng)產(chan)經驗(yan)以及(ji)打包的(de)數據與(yu)算法資源。


“具體而(er)言,一(yi)方面,賽(sai)博平(ping)臺一(yi)定程(cheng)(cheng)度上解(jie)決了(le)(le)規模化多場景的業(ye)務不斷衍(yan)生出的長尾需求。另一(yi)方面,平(ping)臺采用自動機(ji)器(qi)學(xue)習(xi)技術,很大程(cheng)(cheng)度上降低了(le)(le)機(ji)器(qi)學(xue)習(xi)的編程(cheng)(cheng)工(gong)作(zuo)量、節約(yue)了(le)(le)AI 開發時間、減輕(qing)了(le)(le)對(dui)專業(ye)數據科學(xue)家與算法工(gong)程(cheng)(cheng)師的依(yi)賴,讓缺乏機(ji)器學習(xi)經驗的(de)開發(fa)者(zhe)用上AI,加快了(le)開發(fa)效率


“我們(men)通過產品和服務來獲得(de)行(xing)(xing)業認可(ke)。我們(men)認真服務每(mei)一個客(ke)戶,認真解(jie)決客(ke)戶問題。”康鐵(tie)鋼說道:“我們(men)會專注于人(ren)工智能(neng)領域,致力于人(ren)工智能(neng)領域的理論研究與應用(yong)開發,不(bu)斷(duan)創新,為(wei)企(qi)業降本增(zeng)效(xiao),通過人(ren)工智能(neng)提(ti)升社會的運行(xing)(xing)效(xiao)率。”

在線留言