
(資料圖片僅供參考)
作為將圖像信息轉換為文字信息的關鍵技術,OCR(光學字符識別)技術能夠在多場景下實現數據信息提取,有效提高業務效率,被廣泛應用于金融、交通、醫療等多個領域。OCR技術的不斷進步能夠幫助機器更好地理解圖像和文檔,有助于推動AI在圖像識別與文檔處理領域中的可信化落地。
6月29日,合合信息通過中國信息通信研究院(以下簡稱“中國信通院”)“可信AI—OCR智能化服務”評估工作,并獲得“增強級”評級。
現階段,由于OCR標準體系尚不健全,技術和產業缺少統一指導,市場上的OCR產品類目繁多,卻未就“智能化”相關定義形成清晰的概念,給消費者在選購產品、政府在審批企業項目、平臺企業管理產品準入時帶來了選型難題。
中國信通院持續關注OCR技術及應用的發展情況,聯合業內多家企業共同制定《OCR服務智能化分級技術要求和評估方法》,制定了OCR服務在功能、性能、安全等方面的技術要求以及評估方法,為OCR、智能文檔處理技術的研發和產業應用提供參考。OCR智能化服務評估依據《OCR服務智能化分級技術要求和評估方法》開展,共涉及3大能力域、6項能力項及十余項關鍵指標,綜合評估OCR產品的功能、性能和服務成熟度。
其中,功能維度涵蓋基礎類功能測試和增強類功能測試兩個方面,從卡證類、票據類、通用表格、通用圖片等文字識別服務層面,綜合評估OCR智能化產品的功能;性能維度涵蓋多種常見業務場景的文字識別性能測試,例如卡證類文字識別、票據類文字識別等,針對字符準確率/召回率、字段準確率/召回率等指標客觀評估OCR智能化服務的實際應用效果;服務成熟度包括安全性和可靠性兩個能力項,主要評估OCR智能化產品是否具備服務可靠性和安全性保障策略。
本輪測試中,合合信息智能文字識別產品順利通過全部7項基礎類功能指標測試以及9項增強類功能指標測試,獲得“增強級”評級,其智能文字識別產品展現出良好的性能和服務成熟度。以具有較大難度的證件類和票據類性能測試為例,面對旋轉、陰影、反光、褶皺、形變、模糊、多語言、低像素、光照不均等復雜場景,合合信息智能文字識別產品均有較高的識別準確率,字符準確率分別為99.21%和99.59%,字段準確率分別為97.87%和98.42%。
此外,測試結果顯示,合合信息智能文字識別產品支持超過50種復雜語言的識別,為全球化、多語言背景下的信息智能識別提供了技術支撐。現階段,合合信息智能文字識別技術已落地于銀行、保險、證券、制造、政務等近30個行業,服務全球超過200個國家和地區的個人及企業用戶。
(文章來源:證券日報)
關鍵詞: