搜索

Help

第225页,共365页。 显示 3,642 条结果 (0.265 秒)

  1. 数据权限设置—数据挖掘和自助ETL

    针对数据挖掘和自助ETL的数据源创建的数据权限。 在关系数据源和数据集中通过对查询的目标表设置数据权限,当数据挖掘和自助ETL的数据源导入中涉及到这些表时,数据权限设置条件会自动启用。 下面我们以关系数据源为例来演示如何设置数据权限,数据集也同理。 设置数据权限 1、在数据连接的资源目录区中找到要设置数据权限的表,点击更多菜单image2020-8-14_10-31-52.png选择 设置数据权限。 443.png 2、进入“设置数据权限”界面,点击 添加,为刚才选择的表添加数据权限。 444.png 3、对用户“管理员“”设置权限:产品大类名称只能查看“点心”。 445.png 关于界面相关设置,详情可
  2. 数据挖掘-标准化

    概述 标准化数据使数据具有单位标准差归一化或平均数据中心化。 单位标准差归一化:将输入数据进行单位标准差归一化,使转换后的数据具有单位标准差; 平均数据中心化:将输入数据进行中心化,使转换后的数据均值为0。 如果某个特征的标准差为0,则该特征的返回结果也为0。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片17.png 单位标准差归一化
  3. 数据挖掘-相关性分析

    概述 相关性分析是用来反映变量之间的相关关系的密切程度。相关系数的取值一般介于-1和1之间。当相关系数为正的时候,意味着变量之间是正相关的;当相关系数为负的时候,意味着变量之间是负相关。 相关性分析常用在数据探索阶段,当我们并不了解原始数据各字段之间的关系时,通过相关性分析,可以看到各个字段之间的相关性,其后进行的数据分析工作可以围绕这些相关性展开。 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出相关系数的数据集。 参数设置 参数名称 说明 备注 选择列 用于选择进行相关性分析的字段列 必填
  4. 数据挖掘-全表统计

    概述 全表统计是对观测数据进行不同的统计分析,可统计信息:最小值、最大值、平均值、标准差、方差、总和、行数、唯一值、缺失值、偏度、峰度、中位数、下四分位、上四分位、众数等指标;还可使用箱线图和直方图尽可能简单全面表达数据所蕴含的数值范围、分布等信息。 输入/输出 输入 一个输入端口,用于接收数据集 输出 没有输出端口 参数设置 参数名称 说明 备注 选择列 选择需要统计的特征列(列数<=10) 必填 可选统计 选择需要的指标进行统计分析。可选的指标:偏度、峰度、总和、众数、方差、标准差、缺失值。 使用全表统计节点默认统计的指标
  5. 数据挖掘-RFM

    概述 通过对选择的特征列按照阈值进行二分(可按均值、指定值、中值),将客户数据划分为不同的客群。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 可选列:选择需要进行划分的字段,仅可选数值型字段; 划分方法:可按均值、中值和指定值进行二分; 指定值:当划分方法选择指定值时,用于设置划分的阈值; 必填 示例 使用“航空公司客户价值分析”数据,划分结果生成两个标签列BinaryClass和RFMClass
  6. 数据挖掘-LDA

    概述 LDA是一种主题模型。它是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。 它是一种非监督机器学习技术,可以识别出大规模文档集或语料库中的主题。 常用于做文本挖掘聚类分析。 参数设置 参数名称 说明 主题数目 主题数,或者聚类中心数。默认值为2。 迭代次数 模型的迭代次数,达到该迭代次数即退出。默认值为10 文档主题分布 文章分布的超参数(Dirichlet分布的参数),必需>=0,默认值为1。 值越大,推断出的分布越平滑 主题词分布 主题分布的超参数(Dirichlet分布的参数),必需>=0,默认值为1
  7. 数据挖掘-评分卡构建

    概述 评分卡构建节点是评分卡模型的构建过程,用于把训练完成的逻辑回归模型转换为评分模型,具体转换规则可通过设置评分卡构建节点中的参数实现。 输入/输出 输入 两个输入端口,输入1接收训练好的逻辑回归模型,输入2接收WOE编码模型 输出 一个输出端口,用于输出训练后的评分卡模型 参数设置 参数名称 说明 备注 基础分 预设的初始分值 评分基准线 好坏比 基础分所对应的初始好坏比(好样本概率和坏样本概率的比例) 好坏比参数越大,评分变化幅度越大 PDO 好坏比翻倍对应提升的分值 取正值时,评分越高代表信用越好
  8. 数据挖掘–指数平滑

    列,名称规则为被预测列的列名增加前缀,输出结果经过了指数平滑算法的拟合处理。另一列表明拟合列中的数据是否是预测结果,0表示是对历史数据的拟合,1表示是通过拟合数列对未来的预测。 image2023-1-15_0-39-15.png
  9. 如何创建原生SQL查询

    datasourceId 数据源ID。 * @param sql "原生SQL查询"的SQL语句。 * @param name 数据集的名称。 * @param alias 数据集的别名。 * @param desc 数据集的描述。 * @param folderId 用来保存数据集的指定目录ID
  10. 宏模块里如何获取到用户默认组信息

    编号 var name = defaultGroup.name; // 用户默认组名称 var alias = defaultGroup.alias; // 用户默认组别名 var desc = defaultGroup.desc; // 用户默认组描述 用户组 js