安恒AiMask数据脱敏系统
AiMask,是一款具有丰富数据库支持度、高性能、高可扩展性的数据脱敏与数据溯源产品。产品功能敏捷数据自动发现:AiMask内置多种发现规则,支持基于数据内容的识别,不仅依赖于用户的元数据管理系统、字段名或字段注释等信息。支持用户基于自身需求自定义规则,实现对敏感数据的自动发现和
- 敏感数据发现快、准、全
- 强大的并发处理能力
- 强大的可溯源脱敏算法
- 严格的数据质量管理
- 开放API能力
产品功能
敏捷数据自动发现:
AiMask内置多种发现规则,支持基于数据内容的识别,不仅依赖于用户的元数据管理系统、字段名或字段注释等信息。支持用户基于自身需求自定义规则,实现对敏感数据的自动发现和标识。
同时AiMask可同安恒数据分级分类平台(AiSort)进行对接,可基于行业或法律法规对敏感数据进行分类分级与梳理,便于用户按照不同级别进行脱敏算法的配置,有效避免数据的过度保护。
AiMask支持采用随机采样的方式,在采样的过程中过滤空值及脏数据。如在业务初期数据逻辑定义不规范往往会产生较多脏数据,而传统的敏感数据检索方式通常问简单过滤表中前若干条数据,无法有效避免此类脏数据的干扰。AiMask的随机采样是基于表总行数进行随机抽取,可有效避免脏数据的干扰,提高敏感数据识别的准确性。数据发现算法除常规的正则表达式、字典等,还加入了NLP算法,开箱即用70多种通用敏感字段识别算法,大幅提升了对敏感数据内容的识别和处理能力。有效避免敏感数据的误报、漏报。
丰富的脱敏算法支持:
AiMask支持24大类240+种脱敏算法,适用各种业务场景主要算法支持情况如下:
置空:直接将待脱敏的信息以填充空字符或者删除的形式抹除。
乱序:在结构化数据(例如数据库)中颇为常用,对于待脱敏的列,不对列的内容进行修改,仅对数据的顺序进行随机打乱
遮蔽:保留数据一些位置上的信息,对于敏感位置的信息使用指定的字符进行替换。
分割:保留数据一些位置上的信息,对于敏感位置的信息进行删除
替换:使用固定值或字典映射表对敏感数据进行替换。
取整:对数值类型和日期时间类型的数据进行取整操作。
哈希:将哈希(或哈希加盐)编码后的数据作为脱敏结果输出
仿真(保留业务含义):考虑到业务含义,则生成的数据需符合核验规则,主要包括长度、取值范围以及校验规则和校验位的计算等。
密码学:根据所选参数指定的密码学加密算法对数据进行加密。支持的加密算法有:RSA/AES/SM2/SM4。
编码:根据所选参数指定的编码方式对数据进行编码。
保留类别频次特征:主要指的是反映事物类别的数据类型,具有有限个无序的值,或枚举类型,脱敏后各个类型出现的频次可保持不变。
保留数值统计特征:支持分布重建、平均、区间、标准化、归一化、添加噪声、一致性等算法:对数值型数据在脱敏后可保留数据中的高阶统计特征及数据分布特征,仍满足趋势分析要求。
关联关系保留:支持计算关系保留、乱序关联保留、身份信息关联保留等算法:对数据在脱敏后可保留其原始的字段间关联关系
保留原数据:对指定的列的数据不做脱敏处理。
溯源算法:对数据本身添加仿真水印,做到精准溯源。
灵活的数据抽取:
用户可基于自身需要,灵活配置数据抽取的增量条件,AiMask可支持的增量条件包括但不限于以下方式:
基于时间戳
基于主键或唯一键
基于分区或分片
保证数据完整性:
数据被清洗后不改变数据原有类型、长度、不包含其他无效信息,不违反原有数据约束。且能将源表的主键、索引、唯一约束自动同步到目标表,避免人工干预,提高脱敏工作效率。
保证业务逻辑关联性:
复杂的业务系统中,往往若干表的字段间存在复杂的关联关系,有物理或逻辑上的主外键,AiMask脱敏后可保证此类关联关系不变,物理或逻辑主外键依然可以建立。不会影响系统接入后的正常运行。
保证数据原始特征:
根据所配置任务的具体要求,脱敏后的数据逻辑需要与之前保证一致,如手机号脱敏后依然是手机号,身份证脱敏后依然为身份证。因此具有这类要求的数据不能简单的采用字符串替换或遮蔽的方式进行处理,AiMask支持脱敏后的数据必须能够准确反映原始数据的业务属性、数据关联和数据分布特征,满足业务系统的数据规则。如果表或业务系统对数据本身有入库校验,依然可通过该校验,顺利入库。
水印与溯源:
支持多种数据水印格式,包括并不限于伪行水印、伪列水印、脱敏水印、内容修改水印。
通过添加配置比例的数据行或数据列来插入水印信息,当数据泄露后,通过提取伪行/伪列水印信息来进行泄露追溯。
支持基于数据本身特征脱敏水印方式,不影响业务逻辑的同时能有效的避免了水印数据被绕开。
适用于不能影响数据的业务含义并具有较强的业务使用或分析需求的场景,同时隐蔽性要求高。
数据保密性:
敏感数据全程不落地,避免产品本身成为数据泄露的一个风险点。
断点续传:
支持脱敏任务暂停后,重新开始时从暂停处继续执行,可在业务高峰期时暂停脱敏任务,在业务低峰时继续脱敏任务,从而避免重复脱敏的同时,也能避免的系统资源占用问题,保障业务运行不受影响。
脱敏报表:
支持指定时间段内的脱敏任务统计报表,包括并不限于脱敏任务名称、脱敏执行时间、数据库类型、任务概况、脱敏算法分布情况、脱敏数据量占比情况,同时可配置对比时间周期,从而获取脱敏的变化情况。
客户价值
降低用户数据泄露风险:
AiMask可根据不同的用户场景,制定不同的脱敏策略。灵活梳理、清洗各类敏感数据,为客户提供从敏感数据盘点、梳理、脱敏的全方位的管控,尽量避免数据丢失。
减轻用户工作量:
AiMask支持主流数据库类型,配合强大的仿真脱敏算法,将用户从传统的脚本脱敏中解放出来,使用户不必在去针对数据库和不同的表设计、字段逻辑逐一开发脱敏脚本,同时为用户提高了脱敏后数据的数据质量。
符合监管要求:
从网安法到各个行业规范均要求生产数据不得直接用于开发测试,数据入仓分析前需进行去标识化、去个性化处理,AiMask可帮助用妥善处理数据清洗与脱敏,满足相关法规与监管要求。
灵活适应各种复杂分析场景:
AiMask可基于用户各类分析需求,灵活配置各类脱敏算法,如姓名可选择保留姓或保留名;数值类型脱敏后可按具体要求保留统计特征等。
购买说明
基础版:支持基础数据库,可次付和年付。
标准版:除支持基础数据库外,另支持大数据数据库,可次付和年付。
高级版:除支持基础数据库、大数据数据库外,另支持云仓,可次付和年付。
全部用户
商品定价
商品价格=订购区间数量1*区间规格单价1+订购区间数量2*区间规格单价2。
举例:通话费率为不超过3分钟的部分按0.3元/分钟,超过3分钟的部分按0.2元/分钟;如果用户通话8分钟,收取的费用为3*0.3+5*0.2=1.9元。
商品价格=订购数量*数量所属区间单价。
举例:通话费率为不超过3分钟则0.3元/分钟,若超过3分钟则0.2元/分钟;如果用户通话2分钟,收取的费用为2*0.3=0.6元;如果用户通话8分钟,收取的费用为8*0.2=1.6元。
商品价格=订购数量*单价。
商品价格为页面呈现价格。