检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
图1 增值税发票示例图 图2 区块链发票示例图 图3 全电发票示例图(专用发票) 图4 全电发票示例图(普通发票) 对于区块链发票与增值税电子普票的区别参考如下: 一般电子普通发票除了地名,均标明“增值税电子普通发票”,区块链发票除了地名外只标明“电子普通发票”。
电子面单识别 OCR电子面单识别将于2025.02.18正式停售,为避免影响您目前的业务,请您及时进行相关迁移工作,详见停售公告。 功能介绍 识别用户上传的电子面单图片中的文字内容,并将识别的结果以JSON格式返回给用户。 图1 电子面单示例图 约束与限制 电子面单支持的版式以样例为准
支持区域: 华北-北京四 增值税发票识别API 发票验真 支持9种增值税发票的信息核验,包括增值税专用发票、增值税普通发票、增值税普通发票(卷式)、增值税电子专用发票、增值税电子普通发票、增值税电子普通发票(通行费)、二手车销售统一发票、机动车销售统一发票、区块链电子发票,支持返回票面的全部信息
可查验最近5年内(国家税务总局)增值税发票管理系统开具的发票。 税务局数据同步有时延,建议当天新开的发票在24小时后查询。
图3 API Explorer 代码运行报错 Microsoft.Extensions.DependencyInjection.Abstractions, Version=3.1.0.0, Culture=neutral 出现该错误是因为项目缺少所需的 Microsoft.Extensions.DependencyInjection.Abstractions
true:返回置信度 false:不返回置信度 如果未传入该参数,系统默认为“false”,即不返回置信度。 return_excel 否 Boolean 是否返回表格转换Microsoft Excel的Base64编码字段。
return_text_location 否 Boolean 识别到的文字块的区域位置信息。可选值包括: true:返回各个文字块区域 false:不返回各个文字块区域 如果无该参数,系统默认不返回文字块区域。如果输入参数不是Boolean类型,则会报非法参数错误。
图2 我的凭证 安装SDK 在Linux系统上安装SDK 获取依赖包 所需的这些第三方软件包在大部分系统的包管理工具中都有提供,例如基于 Debian/Ubuntu 的系统。
return_issuing_authority 否 Boolean 是否返回发证机关的开关,可选值包括: true:返回发证机关 false:不返回发证机关 如果无该参数,系统默认不返回发证机关。如果输入参数不是Boolean类型,则会报非法参数错误。
front:身份证人像面 back:身份证国徽面 double_side:身份证双面信息 如果参数值为空或无该参数,系统自动识别,建议填写,准确率更高。
护照识别 china_passport或foreign_passport 护照 银行卡识别 bankcard 银行卡 道路运输证识别 transportation_license 道路运输证 增值税发票识别 vat_invoice 增值税专用发票 增值税普通发票 增值税电子普通发票(含区块链发票
BasicCredentials(ak, sk) def get_client(): config = HttpConfig.get_default_config() config.ignore_ssl_verification = True return
其中系统级约束限制,是所有子服务的约束。除系统级约束限制外,各子服务还有独立的约束条件。 智能文档解析 支持中英文及部分中文繁体字。
file_path, save_root): self.file_path = file_path self.save_root = save_root @staticmethod def open_pdf(file): return
可选值如下: front:身份证正面 back:身份证背面 如果参数值为空或无该参数,系统自动识别,建议填写,准确率更高。
一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 图1阐明了区域和可用区之间的关系。 图1 区域和可用区 目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域和可用区。 如何选择区域?
通用表格识别是否支持导出为excel格式 通用表格识别支持将表格内容转换成可编辑的Excel格式,传入参数return_excel为true时,将返回的表格转换为Microsoft Excel对应的base64编码,可用Python函数 base64.b64decode解码后保存为
该代码用于图片等比例放缩,比较图片长边和输入参数max_size,如果图片长边超过max_size,则对图片进行等比例放缩,否则返回原图 :param max_size: 图片长边允许的最大长度(根据具体场景进行设定,在保证文字清晰度的情况下,建议设置小一些) :return