页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

...

数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。

信息

1、脱敏规则支持 字符串、数值 字段脱敏,暂不支持日期字段进行脱敏。

2、重建索引过程中,如果正在新建修改脱敏规则,会提示 索引正在重建中,请稍后再操作!

3、数据集抽取 : 抽取后,预览数据会根据脱敏规则进行脱敏;如果用高速缓存库中的宽表建资源数据不脱敏。

4、如果维度、度量设置了脱敏规则并且是开启状态:

  • 在预览、编辑、查看状态下,脱敏规则都需生效。

  • 排序: 数值型脱敏之后排序可能无效了,可能会重新排序. 

  • 导出数据时:根据使用的脱敏规则的应用,如果应用于“导出”,导出数据则需要生效;

  • 发布到移动端,脱敏规则会生效。

  • 数据脱敏会导致部分功能无法使用,如自定义排序(业务主题)、钻取、联动、跳转等; 

  • 数值脱敏后,如果是字符替换,无法用于做非表格组件,比如柱图、饼图等,如果拖入脱敏后的度量到【行/列区】需要提示,标记区应该不受影响。

  • 如果维度、度量设置了脱敏规则,但是后面删除或者禁用; 脱敏规则需要立马失效。

  • 快速计算:原始度量设置了脱敏规则,快速计算需要继承原始度量的脱敏规则;区间脱敏也是一样。

  • 筛选器:设置了脱敏规则的数值型、字符串字段,如果作为筛选器,筛选不了数据;

    字段脱敏,暂不支持 日期 字段进行脱敏。

    2、字符串、数值字段如果设置了脱敏规则,再使用该字段去做二次计算比如:计算度量新建计算列、新建计算字段、新建命名集新建计算成员等构建的新字段,都会继承脱敏规则,使用***显示。

    3、重建索引过程中,如果正在新建修改脱敏规则,会提示 索引正在重建中,请稍后再操作。

    4、数据集抽取 : 抽取后,预览数据会根据脱敏规则进行脱敏,但是存储在高速缓存库中的数据是不脱敏的。

    5、在数据模型中设置了 度量 比如销售额 的脱敏规则,在维度中的销售额 没有设置脱敏规则,在查询清单时,不会继承 度量 销售额的脱敏规则。

    6、数值区间脱敏,在仪表盘导出数据时,目前暂时不支持导出显示值。

    7、数值脱敏,每次清空缓存会根据算法重新计算,即清空缓存之后脱敏会的数据会改变。

    8、字段设置了脱敏,如果字段切换成计数、唯一计数,脱敏规则会失效(由于原先的业务含义改变了)。

    2 操作说明

    2.1 功能入口

        通过“新建脱敏规则”,或者打开已定制的脱敏规则,都可以打开“脱敏规则”设置界面。

        入口:运维设置 / 全局资源定义/ 脱敏规则/ 右键菜单/ 新建/ 脱敏规则:

         

    2.2 界面介绍

    各设置项说明如下:

    设置项说明
    算法名称输入脱敏规则名称。
    算法别名输入脱敏规则别名。
    脱敏类型支持 字符串、数值型字段脱敏。
    脱敏字段

    选择进行脱敏的字段。

    • 如果脱敏类型是 字符串,那么选择字段时只能选择字符串类型的字段。
    • 如果脱敏类型是 数值型,那么选择字段时只能选择数值类型的字段。
    • 选择字段的范围:源表、业务主题、各个数据集

    Image Added

    脱敏算法
    系统支持如下三种脱敏算法:

    1、字符串字段支持:

    • 掩码:是一串二进制代码对目标字段进行位与运算,屏蔽当前的输入位。
    • 正则替换:利用Java语法的正则表达式进行字符串替换。
    • 字符替换:利用指定的符号替换字符串。
    其中 数值型的脱敏类型只支持 字符替换

    2、数值型字段

    • 字符替换:利用指定的符号替换字符串,在报表展示会直接显示替换的字符,所以这种方式无法用于图表作图。
    • 缩放归一算法:设置区间显示的方式,通过算法计算出脱敏后的值,脱敏后的数据不管怎么浮动始终会在设置的区间中,在使用图表展示时,保持趋势正确。
    算法参数

    主要是 字符串 不同的算法支持的参数不同:

    • 掩码:确定保留内容以及替换字符。表示字段中除去保留的部分,其它部分用替换字符替代。
    • 正则替换:输入正则表达式,设置替换字符。表示字段符合正则表达式的字符串用替换字符替代。
    • 字符替换:设置替换字符。表示字段所有字符串用替换字符替代。
    应用范围

    表示当前脱敏规则生效的用户对象,可以通过对用户、用户组、角色进行设置。

    注意

    1)当选择“适用于此范围”,且“范围定义

    ”无内容或为空时,则对所有角色、用户、用户组不生效;

    ”无内容或为空时,则对所有角色、用户、用户组不生效。

    2)当选择“不适用于此范围”,且“范围定义”无内容或为空时,则对所有角色、用户、用户组生效。


    应用于表示当前脱敏规则生效的情景:是在浏览资源时生效还是在导出资源时生效,或者两者都生效。
    禁用表示禁用当前脱敏规则。

    Image Removed

    各设置项说明如下:Image Added

    2.3 示例

    2.3

    ...

    .1 字符串示例

    不同算法的参数设置示例及效果如下:

    算法参数设置项效果
    掩码

    以下设置是将整个电话号码每个数字都用“*”替代。

    Image Modified


    Image Modified

    正则替换

    以下设置是将电话号码区号后面的数字串用“*”替代。

    Image Modified


    Image Modified

    字符替换

    以下设置是将整个电话号码的数字串都用“*”替代。

    Image Modified

    Image Modified

    2.3.2 数值型示例

    信息

    1、数值脱敏,每次清空缓存会根据算法重新计算脱敏后的数据,即清空缓存之后脱敏会的数据会改变。

    2、数值区间脱敏的最小、最大值都必须设置;

    数值脱敏需要通过偏差值计算得出,而偏差值是通过区间的最大值,最小值计算得出;

    数值脱敏之后,就算是去作图显示,脱敏后的值是在区间范围内波动展示。


    1、创建脱敏规则,命名为 数值脱敏,并且脱敏算法选择 字符串替换,替换字符串为 * ,如下图,为了演示效果,应用范围 默认选中“不适用于此范围”:

    Image Added

    2、再创建脱敏规则,命名为 数值区间脱敏,脱敏算法选择 区间归一缩放,并且设置好区间:

    • 点击 +添加区间 支持添加一个区间范围。
    • 区间范围:只能输入数值,并且已经重复输入的范围或其他区间已包含的范围,不能新增。比如已输入0~100(大于等于0,小于等于100),不能再建50~80(大于50,小于等于80)的区间。
    • 为了演示效果,应用范围 默认选中“不适用于此范围”

    Image Added

    3、基于产品自带的northwind数据库,使用 “订单明细表”、“订单表”等创建模型。

    4、创建好模型,再创建计算度量“销售额”,如下图:

    Image Added

    5、设置 字段 数量 的脱敏规则为:数值脱敏,设置 销售额 的脱敏为 数值区间脱敏:

    Image Added

    6、保存模型,并且去创建仪表盘

    • 查看 区域、省份、城市的数量,如下图,全部脱敏变成*。

         Image Added

    • 查看 区域、省份、城市每日销售额,如下图(注意,在仪表盘导出数据只能导出真实值)。

    Image Added

    7、基于创建好的模型,去创建WEB电子表格/ 电子表格:用于展示 区域、省份、城市每日销售额。

    • 拖入维度和度量,如果是数值脱敏的字段需要设置 使用显示值
    • 双击字段单元格,依次设置好销售额的 使用显示值,设置成 是,如下图所示

    Image Added

    再预览数据才能正常显示脱敏后的数据。


    2.4 数据脱敏应用范围

    类型  

    是否支持

    数据源

    本地数据源

    关系数据源

    Java数据源

    Nosql数据源

    多维数据源

    高速缓存库

    ×

    跨库联合数据源

    数据集

    数据模型
    业务主题
    自助数据集

     
     
     

    可视化数据集

    SQL数据集

    原生SQL数据集

    存储过程数据集

    JAVA数据集

    多维数据集

    ×

    分析展现
     
     
     
     
     
     
     
     
     
     
     
     
     
     

    自助仪表盘/大屏可视化

    交互式仪表盘

    即席查询

    透视分析

    灵活分析

    即席查询

    仪表分析

    电子表格

    透视分析

                                      web电子表格                                                       √

    2.5 数据脱敏继承关系

    2.5.1 继承规则

    序号内容
    源表设置了脱敏规则

    源表的脱敏规则最大:

    • 在源表设置了脱敏 引用到模型里面时, 作为 维度 要继承源表的脱敏规则;作为 原子度量,也要继承源表的脱敏规则;引用 原子度量 创建 计算度量新建计算列新建命名集新建计算成员等,也会默认继承源表字段的脱敏规则。

    • 如果源表设置了脱敏规则,在模型里面又设置了脱敏规则,则优先取源表的,再按照创建的时间顺序取其他的,最终是 并集 效果。

    数据集设置脱敏

    如果源表没有设置脱敏规则,只是在数据集设置脱敏规则:

    SQL查询、SQL数据集(SQL方式)在源表设置了脱敏规则,写SQL无法继承源表字段的脱敏规则,比如在数据模型中使用SQL查询,需要重新设置脱敏规则
    脱敏规则的缓存

    默认读取数据集的缓存策略,比如:数据模型是禁用缓存则脱敏规则也是禁用缓存

    设置脱敏规则原则报表层原则上不设置脱敏规则。

    2.5.2 涉及脱敏/脱敏继承的细粒度

    涉及脱敏/脱敏继承的细粒度

    支持独立设置

    支持继承

    源表字段(字符串、数值型)


    维度(字符串、数值型)

    原子度量、切换聚合方式的原子度量

    快速计算

    X

    计算字段

    灵活分析

    计算度量/向导计算

    仪表分析

    电子表格

    计算列

    命名集

    X

    计算成员X
    分组字段

    2.5.3 继承规则流程说明

    1、 如果在在源表设置脱敏规则:

    Image Added

    2、如果在在源表没有设置脱敏规则,但是在数据模型针对字段设置脱敏规则:

    Image Added

    3、SQL查询、原生SQL数据集、SQL数据集(凡是使用sql的方式)都不会继承源表设置的脱敏规则,需要手工针对字段重新设置:

    Image Added