华为海关单据识别服务–基于文字识别技术[通俗易懂]

华为海关单据识别服务–基于文字识别技术[通俗易懂]业务背景目前,华为公司在海外设有4大供应中心,海关报关单全球一年有35w份左右(其中中国进口5w份,出口15w份,及香港进出口10w份,其它子公司5w份左右)。现在的单据处理方式还停留在通过人工方式将单据内容手动录入到系统中,人工录入的方式除了效率低以外,还存在员工疏忽或者疲劳导致的误操作。如何快速、准确的处理如此数量庞大的单据成为了供应链的一大诉求。问题描述海关报关单据是单据中较为常见的一…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

业务背景

目前,华为公司在海外设有4大供应中心,海关报关单全球一年有35w份左右(其中中国进口5w份,出口15w份,及香港进出口10w份,其它子公司5w份左右)。现在的单据处理方式还停留在通过人工方式将单据内容手动录入到系统中,人工录入的方式除了效率低以外,还存在员工疏忽或者疲劳导致的误操作。如何快速、准确的处理如此数量庞大的单据成为了供应链的一大诉求。

问题描述

海关报关单据是单据中较为常见的一种,它是指在进出口海关时,需要对商品进行描述的报关单,一般各国海关部门会提供图像扫描件,各公司拿到扫描件后需要入库保存。
在这里插入图片描述
随着近几年深度学习的发展,文字识别算法的性能也得到很大的提升。海关单据识别是文字识别重要应用场景,它是指通过机器学习和图像识别技术实现单据内容的自动采集,代替人工手动输入的处理方式。然而,相对于普通的文字识别,海关单据识别主要存在以下几个难点问题:
l 单据图像质量差:海关报关扫描件单据的图像质量往往很差,包括很多干扰虚线、倾斜、暗光、曝光、扭曲以及很多噪声点等。
2 识别精度要求高:由于涉及公司产品的出口,因此业务部门对单据关键数字部分如税率、金额等部分要求识别准确度100%。
3 单据内容复杂:单据中存在大量不清晰中文、小数点、近似英文数字、特殊符号、连接词等内容,其识别难度很大,容易被漏识别或误识别。
4 单据模板多样:不同国家单据模板不一致,如巴西海关完全是文本格式,不是一般的表格单据,在文字检测定位阶段造成困难。

业务目标
针对上述业务背景和业务难题,华为供应链引入了华为海关单据识别服务,实现海关单据自动识别能力,替代人工输入。完成如下业务目标:
对于Top 10国,如:英法西等拉美语系国家,一年单据量约为5万份。通过单据识别服务实现:

  1.   采集历史进口报关单数据,新建数据资产。
    
  2.   采集业务报关单数据,自动在系统赋值,替代人工输入。
    

对于深供中国区POD,一年单据量约50万份,深供国际段POD一年约13万份。通过单据识别服务实现:
3. 识别出与审核相关的要素并结构化。
4. 可根据合同类型的不同,进行审核要素设定及审核结果自动判定。
接下来,我们将使用华为海关单据识别服务Demo,演示华为供应链内部海关报关单据自动识别的解决方案。

解决方案
本章节将演示如何使用华为海关单据识别服务Demo,实现海关报关单据的自动识别方案。
操作步骤
步骤 1 获取海关单据识别服务Demo。链接是这个:(自己去官网找,哈哈哈哈哈哈)
步骤 2 将Demo工程导入Eclipse中。
5. 下载,并打开Eclipse软件。确保“Windows>Preferences>Java>InstalledJREs”配置正确的JRE路径。
6. 在左侧“package Explorer”页面右键,单击“Import”,选择选择“General>Exiting Projectinto Workspace”,单击“Next”,单击“Browse”,选择ais-sdk-demo所在的本地位置。
7. 单击Finish,导入demo,导入后打开工程,工程目录如下:
在这里插入图片描述
步骤 3 获取AK/SK认证。
登录华为云挂你控制台,在“用户中心”页面,“单击账号管理->基本信息->管理我的凭证”,在“我的凭证”页面,单击“管理访问秘钥”页签,新增访问秘钥,下载认证账号的AK/SK。

步骤 4 修改代码文件中的AK/SK。
修改ClientContextUtils.java文件,将替换成已获取的AK/SK值,如图2-2所示。

图2-2 修改AK/SK代码在这里插入图片描述
步骤 5 修改代码中待识别的海关单据图片的路径。
根据本地图片或者使用Demo默认图片存放路径,参考图2-3修改OcrFormDemo.java文件中图片的存放路径。

图2-3 修改待识别图片路径在这里插入图片描述
步骤 6 运行并查看结果。
运行OcrFormDemo.java文件(Run As Java Application ),控制台输出200即表示程序执行成功。识别结果如图2-4所示。

图2-4 识别结果
在这里插入图片描述
其中,运行结果为JSON字符串。index为文字块的序号,排序分别为从左到右,从上到下的固定模板顺序。对应的words为每块的value值(这里不识别表头,只识别value值,方便直接的引用)。识别结果也可保存为JSON格式的文件,如图2-5所示。

图2-5 识别结果文件在这里插入图片描述
—-结束

业务价值分析
目前华为海关单据识别服务已在华为供应链内部得到应用。引入该服务后,有效节省了人力和控制风险敞口,业务流程自动化比例得到提升。
通过单据识别替代人工输入的方式,可实现收益:
建立数据资产,保证报关信息完整归档,满足海关遵从要求。
清关业务自动化比例大大提升。
建立数据资产,保证运输签收信息准确归档,满足财务管理要求。
POD审核业务秒级实时完成,及时触发客户开票。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/190923.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号