搜索

Help

第146页,共618页。 显示 6,172 条结果 (0.106 秒)

  1. 数据源连接

    数据挖掘模块仅支持部分数据源类型,详情请参考 数据挖掘-数据的输入和输出 。 统一平台
  2. ECharts图形-数据设置

    ECharts图形的数据设置包括“字段、分类(X)轴、指标(Y)轴、左垂直(Y)轴、右垂直(Y)轴、并列轴”等等。 2019-10-9 星期三 9-45-56.png {html}<div style="border-bottom: 0.5px solid #dfe1e5;color:#2D5C8C … ;padding-bottom: 0.5px;font-size: 24px; height: 5px;"> </div>{html} 属性说明 设置根节点名称。 例如:图形包括多个城市的产品情况,根节点名称输入北京,则显示北京的数据。 该名称填写时,需要输入已有的数据。 image2019-10-9 11
  3. ECharts图形-数据设置

    ECharts图形的数据设置包括“字段、分类(X)轴、指标(Y)轴、左垂直(Y)轴、右垂直(Y)轴、并列轴”等等。 2019-10-9 星期三 9-45-56.png {html}<div style="border-bottom: 0.5px solid #dfe1e5;color:#2D5C8C … ;padding-bottom: 0.5px;font-size: 24px; height: 5px;"> </div>{html} 属性说明 设置根节点名称。 例如:图形包括多个城市的产品情况,根节点名称输入北京,则显示北京的数据。 该名称填写时,需要输入已有的数据。 image2019-10-9 11
  4. 数据挖掘-归一化

    归一化是一种无量纲处理手段,使物理系数值的绝对值变成某种相对值关系。主要是为了数据处理方便提出来的,把数据映射到某个范围之内处理,更加便捷快速。 归一化实质是一种线性变换,线性变换有很多良好的性质,这些性质决定了对数据改变后不会造成“失效”,反而能提高数据的表现,这些性质是归一化/标准化的前提。比如有一个很重要的性质:线性变换不会改变原始数据的数值排序。 一般需要用到归一化的算法有:支持向量机、梯度提升决策树、逻辑回归、梯度提升回归树、线性回归、K均值、高斯混合模型。 归一化
  5. 数据挖掘-归一化

    归一化是一种无量纲处理手段,使物理系数值的绝对值变成某种相对值关系。主要是为了数据处理方便提出来的,把数据映射到某个范围之内处理,更加便捷快速。 归一化实质是一种线性变换,线性变换有很多良好的性质,这些性质决定了对数据改变后不会造成“失效”,反而能提高数据的表现,这些性质是归一化/标准化的前提。比如有一个很重要的性质:线性变换不会改变原始数据的数值排序。 一般需要用到归一化的算法有:支持向量机、梯度提升决策树、逻辑回归、梯度提升回归树、线性回归、K均值、高斯混合模型。 归一化
  6. 数据门户

    概述说明 通过资源发布功能发布主题到浏览后,可以进入报表浏览界面进行浏览。 界面介绍 在数据门户界面,包含通过 资源发布 功能发布的资源以及“我的空间”。 image2019-8-3 10_57_23.png 首页 首页指“数据门户”界面展现区展示的内容。支持设置其标题和内容,也支持将其隐藏。 设置方法:首页可通过在“系统运维 > 系统选项 > 公共设置”界面的 数据门户首页设置 选项设置是否显示、设置标题名称以及显示的内容。 image2019-9-2 9:1:20.png 首页隐藏 image2019-8-3 11_16_28.png 首页显示 首页显示时,支持设置首页标题以及首页显示的内容。 如下
  7. 数据集定义-私有参数

    私有参数是只能用于当前数据集的参数。 私有参数和公共设置中的参数的区别在于,在数据集中创建或是导入的私有参数,只能用于当前数据集。 私有参数创建和修改的时参数的相关设置请参考 公共设置-参数定义 章节。 私有参数的添加包含两种方式:新建参数和导入参数。 image2019-10-29 16:17:33.png 新建参数 新建私有参数和新建参数功能类似,只是功能创建入口和使用范围不一致。 新建入口:在“数据集输出区”的“私有参数”节点下右键选择 新建参数,进入选择数据源窗口。 image2019-10-29 16:17:50.png 导入参数 私有参数不仅支持创建也支持从公共参数中导入。 功能入口:在“数据
  8. 数据挖掘-特征工程

    特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征工程中包括常见特征工程方法节点。 通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 特征工程简介
  9. 数据挖掘-特征工程

    特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征工程中包括常见特征工程方法节点。 通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 特征工程简介
  10. 数据挖掘-随机森林

    概述 随机森林指的是利用多棵树构成森林对样本进行训练并预测的一种分类器。但是每棵决策树之间没有关联,每棵树都是基于随机抽取的样本和特征进行独立训练。 随机森林算法广泛应用于分类问题。其是决策树的组合,将许多决策树联合到一起,以降低过拟合的风险。随机森林支持连续数据或离散数据进行二分类或多分类。 优势:可反映出特征重要性。 示例 使用“垃圾短信识别”案例数据,预测是否为垃圾短信。 image2020-6-5 16:22:21.png 其中,分词是为了将短信文本进行分成词语方便分析;停用词处理是为了去除不必要的词语、标点符号、语气词等;TF-IDF是为了计算文本数据的idf值,方便进入模型训练