正在查看旧版本。 查看 当前版本.
与当前比较 查看页面历史
« 前一个 版本 7 当前 »
PCA(主成分分析)是统计学上一种常用的方法,主要用来对高维数据进行降维,通过对多个维度进行线性组合,获得较少且能够描述数据特征的主成分指标,减少由于数据维度过多带来的庞大计算量,降低算法的复杂度,使用最少数量的主成分来解释最大量的方差。因为它可减少变量数目以此避免多重共线性,适用于预测变量较多大于观测值数目的情况。
输入
一个输入端口,用于接收前置节点传下来的数据集。
输出
一个输出端口,用于输出接收到的数据集。
参数名称
说明
备注
选择特征列
用于设置待选择的特征列
必填(特征列中不能含有null)
需选择的特征数量
从待选择的特征列中输出特征列的数量
必填范围是[1,已选择特征的数量]的整数,默认值为1
使用“鸢尾花数据”,选择4个特征列和设置需选择的特征数量为2,则输出的结果为2个主成分指标。结果如下图: