数据挖掘-线性回归

示例

使用“波士顿房价预测”案例数据，预测波士顿房价。

其中，相关性分析是为了分析特征变量与目标变量的相关性系数，方便特征选择进入模型训练。

线性回归的参数如下：

参数名称	值	说明
归一化	正则化	详情请参考归一化介绍说明。
	标准化
	最小最大值归一化
	最大绝对值归一化
自动调参设置	系统默认的各项参数值范围。	必须结合“启用自动调参”功能使用。系统将对设置指定或范围内的参数值循环调参，匹配出最优的组合。详情请参考自动调参设置。启用自动调参: 勾选该项，则系统自动调参数，不需要用户手工设置参数。
最大迭代数	参数范围为：>=0的整数，默认值为10	算法的最大迭代次数，达到最大迭代次数即退出。最大迭代次数的值越大，模型训练更充分，但会耗费更多时间。
混合参数	参数范围为：[0,1]的数，默认值为0	控制惩罚类型，平方误差损失函数中的 ρ，参数范围为：[0,1]的数。其中：0表示L2惩罚，1表示L1惩罚，0~1表示L1和L2惩罚的结合。对模型系数惩罚（或称正则化）可减少模型过拟合。
正则参数	参数范围为：>=0的数，默认值为：0。	正则项系数，损失函数中的。正则化可以解决模型训练中的过拟合现象；正则项系数越大，模型越不会过拟合。
epsilon	参数范围为：>1的数。默认值为1.35	huber损失函数中的 δ ；调节损失函数，用于控制算法模型的健壮性； epsilon 越大，损失函数对异常点惩罚就越大，也就是对异常点越敏感；
收敛阈值	参数范围为：>=0的数，默认值为：0.000001。	收敛误差值。收敛误差值，当损失函数取值优化到小于收敛阈值时停止迭代。
损失函数	squaredError	可待优化的损失函数，用于衡量模型的输出值和真实值之间的差距。 squaredError表示平方误差，huber表示平滑平均绝对误差。
	huber

自动调参设置

系统将对设置指定或范围内的参数值循环调参，匹配出最优的组合。

自动调参的方式分为两种：

指定值调参：指定一个固定的值进行自动调参。
范围调参：在指定的范围内进行自动调参。

设置项说明如下：

设置项		说明
拆分比例		将选择的数据拆分为两部分，一部分部分用于模型的评估，另一部分数据用于训练模型。
评估标准		用于选择数据的评估指标，包括：mae、mse、rmse。
参数		自动调参的参数项。
指定值调参	指定值	指定一个固定的值进行自动调参。需要先勾选“是否使用指定值”才能配置。
指定值调参	是否使用指定值	控制是否使用使用指定值进行调参。
范围调参	范围	设置自动调参参数的范围。若运行速度比较慢，可将参数范围调小一点。
范围调参	步数	进行范围调参时，在设置的范围内生成多少个参数值。示例： 1）范围为[3,5]，步数为3时，生成的参数值：3, 4, 5 2）范围为[40,100]，步数为4时，生成的参数值：40, 60, 80, 100

页面树结构

概述

示例

自动调参设置

关注我们

服务支持