文本抽取解决方案

薄言文本抽取平台可以对客户所提供文档的目标要素进行智能抽取，同时抽取部分在文档内高亮提示，有助于提高业务效率。随着行业知识慢慢地向统一格式化靠拢，由于领域需求不同，同一类文件的版式存在千差万别，比如发票，不同行业，不同地市就存在很大的差异。传统的文本处理方式：需要将每种类型的文件

服务商信息：宁波薄言信息技术有限公司

开票主体：宁波薄言信息技术有限公司

支付方式：License

点击查看华为云价格信息

商品详情
商品规格定价
服务支持

商品图片

商品详情

商品亮点

抽取精准度高
样本自动丰富
深度学习，片段感知

商品参数

交付方式

License

交付SLA

15自然日

服务监管

如您购买涉及服务监管的商品，您应在购买后进入买家中心提交需求并及时验收

涉及

开票主体

宁波薄言信息技术有限公司

操作系统

Linux

版本

V1.0

上架日期

2020-10-13

所属类别

商业智能

商品说明

随着行业知识慢慢地向统一格式化靠拢，由于领域需求不同，同一类文件的版式存在千差万别，比如发票，不同行业，不同地市就存在很大的差异。传统的文本处理方式：需要将每种类型的文件都去标注一遍，特别是仅采用OCR的标注，版本稍微有点改动基本就需要重新标注训练。这就给标注工作带来了巨大的压力，且效率低下。那么，薄言文本抽取平台有哪些优势呢？
第一、联合研究的深度学习模型：采用全新预训练模型SegaBERT，在原始位置向量的基础上，对段落、句子、词语三者间的位置关系联合建模，更符合语言逻辑习惯，也更有益于模型学习。SegaBERT不止在各种任务集上比BERT有提升，对输入文本的编码逻辑上也有显著区别，能做到片段感知，即根据段落、句子的分隔信息进行编码。所以在相同的训练数据、计算资源与模型规模条件下，SegaBERT取得了较为明显的提升效果。
第二、标注样本自动丰富：大量的训练样本可以用来观测模型常见错误，利用后处理修正，提取或修正分段特征，包括向已有的标注样本加入一些特征来进行样本扩充和信息多样化。
第三、精准度高：除了采用领先的模型来提升效果外，我们结合薄言自身研究的语法引擎，增加对标注和训练样本预处理，能够自动筛选出更合理的数据，并对一些样本自动泛化出一系列意思相近的样本数据，这样就极大地增加了覆盖面，最终精准度明显要优于同行的其他产品。

商品规格中，标配版的文本抽取服务，提供通用模型的文本抽取服务；高级定制版的文本抽取服务，提供根据行业特性进行定制开发的文本抽取服务。

销售对象

全部用户

商品定价

购买方式

Step阶梯定价

商品价格=订购区间数量1*区间规格单价1+订购区间数量2*区间规格单价2。

举例：通话费率为不超过3分钟的部分按0.3元/分钟，超过3分钟的部分按0.2元/分钟；如果用户通话8分钟，收取的费用为3*0.3+5*0.2=1.9元。

Tier阶梯计价

商品价格=订购数量*数量所属区间单价。

举例：通话费率为不超过3分钟则0.3元/分钟，若超过3分钟则0.2元/分钟；如果用户通话2分钟，收取的费用为2*0.3=0.6元；如果用户通话8分钟，收取的费用为8*0.2=1.6元。

线性定价

商品价格=订购数量*单价。

简单定价

商品价格为页面呈现价格。

服务支持

使用指南

文本抽取解决⽅案使⽤指南(最新版).pdf 下载

平台支持范围

售后服务时间：5 * 8小时
售后服务内容：使用答疑，异常处理，日常运维
服务热线：+86-0574-27960053
服务邮箱：zqz@rsvptech.cn
联系电话：+86-15867530262/+86-15888180505

商品服务协议

订购此商品即为您同意《商品服务协议》