概述
全表统计是对观测数据进行不同的统计分析,可统计信息:最小值、最大值、平均值、标准差、方差、总和、行数、唯一值、缺失值、偏度、峰度、中位数、下四分位、上四分位、众数等指标;还可使用箱线图和直方图尽可能简单全面表达数据所蕴含的数值范围、分布等信息。
输入/输出
输入 | 一个输入端口,用于接收数据集 |
---|---|
输出 | 没有输出端口 |
参数设置
参数名称 | 说明 | 备注 |
---|---|---|
选择列 | 选择需要统计的特征列(列数<=10) | 必填 |
连续数据分桶数 | 设置连续数据分桶数,分桶数为>=2的整数,统计结果中,数值变量会按照这个分桶数来分箱展示 | 必填 |
示例
使用“鸢尾花数据”,选择4个特征进行全表统计,查看分析效果如图: