概要说明
用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。
散点图用来研究变量之间的关系。
含义 | 图例 |
---|---|
用于表示数据项少于2000的数据的关系。最常用的散点图,常用来判断变量之间的关联。 | 下图展示了折扣和销售量之间的关系,随着折扣增加,销售量增加,呈正相关关系: |
用于表示数据项大于2000的数据的关系。通常用来研究区间分布模式。 | 下图是模拟三角函数(正弦sin)的图像显示,体现周期性特点: |
优势:研究两变量之间的关系,或区间分布模式。
劣势:适用范围较窄。
数据要求:一个或两个维度,两个度量;分类字段,散点图通常用于比较跨类别的聚合数据。
适用场景:销售量和折扣之间的关系;收入和消费之间的关系;三角函数关系;社会现象关系的研究等 。
业务情景
我们在业务分析中,经常会对研究对象进行对比分析。散点图主要有如下两个应用情景:
研究对象对比需求 | 分析 | 效果 |
---|---|---|
情景1:研究促销活动销售量和折扣之间的关系。(数据量小于2000) | 该需求的研究对象对比分析,想要研究变量关系且数据小于2000,建议通过散点图实现。 1、分类轴上显示折扣 2、指标轴上分布销售量 3、把产品名称拖动到颜色标记区以实现数据点的区分。 该情景详细的实现说明请参见 55838993 。 | |
情景2:研究促销活动销售量和折扣之间的关系,看出哪些产品的销售量受折扣影响较大。(数据量小于2000) | 该需求的研究对象对比分析,想要研究变量关系,数据小于2000,且受影响较大的产品,建议通过泡泡图实现。 1、分类轴上显示折扣 2、指标轴上分布销售量 3、把产品名称拖动到颜色标记区以实现数据点的区分 4、把产品名称拖动到大小标记区 该情景详细的实现说明请参见 55838993 。 | |
情景3:三角函数图像的研究。(数据量大于2000) | 该需求的研究对象对比分析,研究图像分布,数据量大于2000,建议通过大数据散点图实现。 1、分类轴上显示c_x 2、指标轴上分布sin 该情景详细的实现说明请参见 55838993 。 |
实现方案
情景1
业务情景描述:研究促销活动销售量和折扣之间的关系。
数据结构
以上业务情景的数据来源如下:
我们的基础数据以明细表的形式存储。
定制要点:
双击“折扣”、“销售量”和“产品名称”字段,系统自动把第一个度量分配到“列区”,把第二个度量分配到“行区”,把维度分配到“颜色”标记项。
对于度量值,系统默认“合计”,此时只有一个数据点,需要把该度量改为“维度”,数据才会表示原数据点;
或者拖拽“折扣”字段到“列区”,“销售量”字段到“行区”,“产品名称”到“颜色”标记项。
上图表示销售量与折扣之间的关系,随着折扣增加,销售量增加。
情景2
业务情景描述:研究促销活动销售量和折扣之间的关系,看出哪些产品的销售量受折扣影响较大。
数据同情景1。
定制要点:
在情景1的基础上把“产品名称”字段拖动到大小标记区。
上图表示销售量与折扣之间的关系,随着折扣增加,销售量增加。点大的表示数量大,表示该产品折扣对其销售量的影响更大。
情景3
业务情景描述:三角函数图像的研究。
数据结构
以上业务情景的数据来源如下:
定制要点:
在标记区点击 三角 下拉按钮,切换为大数据散点图,如下:
双击“c_x”和“sin”字段,由系统自动分配第一个度量值到“列区”、第二个度量值“行区”。
对于度量值,系统默认"合计",此时只有一个数据点,需要把该度量改为“维度”,数据才会表示原数据点;
或者拖拽“c_x”字段到“列区”,“sin”字段到“行区”。
上图是三角函数sin的图像。
度量计算
来源于自助数据集/业务主题的自助仪表盘可通过单击度量字段,对表中的度量指标进行合计、最大值、最小值、平均值、计数、唯一计数等计算;详情可参考文档度量计算-基于自助数据集/业务主题。
来源于数据模型的自助仪表盘则需返回数据模型界面进行设置;详情可参考文档度量计算-基于数据模型。
快速计算
来源于数据模型的自助仪表盘,可对表中的度量指标进行占比、排名、同比、同期值、环比、前期值等计算;详情可参考文档快速计算
值轴设置
值轴设置可修改轴的数据格式、最大值和最小值等。
在行列区字段的更多操作中,选择”值轴设置“,设置如下:
效果对比如下:
设置 | 效果 |
---|---|
设置前 | 设置前所有散点位置偏右,没有居中显示。 |
设置后 | 设置后可显示自定义轴的名称,并且所有散点位置居中,效果比较美观。 |
设置项说明如下:
名称 | 说明 | |
---|---|---|
轴位置 | 行区字段为上轴,列区字段为下轴,不支持上下轴的切换。 | |
轴名称 | 用于自定义轴的名称。 | |
数据格式 | 用于设置轴刻度的数据格式。 例如:当轴刻度数据较大时,可将5000000设置为500万,使图形效果更加美观。 下拉框中的数据格式来源于公共设置中的数据格式。 | |
对数轴 | 对数轴以 10 的幂次增长的算法来绘制轴标签,可与最大值、最小值一起使用。 当同一指标轴上两指标数据差距特别大时,可以对数值小的指标进行对数轴处理,使数据图形效果看起来更美观。 | |
刻度值 | 自动(默认) | 轴刻度根据需要显示的指标,自动调整最大值、最小值。 |
自定义 | 用于在编辑框内自定义刻度值的最大值、最小值。 支持在字段选择框中选择字段,或在公式编辑框中输入数值,或加减乘除四则运算。
|
散点图注意事项
(1)自助仪表盘如需使用“自助数据集”,需更换包含"自助数据集”的License文件
(2)若无法在自助仪表盘中使用业务主题,需前往系统选项>高级设置 中添加"DISABLE_BUSINESS_THEME_IN_DASHBOARD=false"