搜索

Help

第61页,共297页。 显示 2,969 条结果 (0.282 秒)

  1. Excel融合分析如何处理超大数据量

    1. 背景 一线的业务人员获取Excel明细表,原始数据量动辄几十万上百万条;虽然Excel是一款深受青睐、广泛使用的数据处理工具,但是Excel自身在处理大数据量情况下存在性能问题;并且当大数据量的Excel分析报表展现在web上会占用太多缓存,会容易撑爆内存导致宕机。 基于上述背景,本文将介绍在创建大数据量的Excel融合分析报表过程中,应该采取哪些操作方案,能够有效避免大数据量导致卡顿、提升查询性能。 2. 操作步骤 2.1 数据准备方式 在创建Excel融合分析报表前的数据准备阶段,我们可参考如下两个方式操作: 查询情况 操作要点 效果  单表查询 创建透视分析数据集
  2. 数据挖掘-快速入门

    /52627427/%E5%BF%AB%E9%80%9F%E5%85%A5%E9%97%A81.mp4?version=1&modificationDate=1592875303000&api=v2 本文档将按照如下流程,以客户流失问题为背景,为您介绍如何快速在Smartbi Mining上搭建实验: 流程图1126.png 案例背景 现在银行产品同众化现象普遍存在,客户选择产品和服务的途径越来越多,客户对产品的忠诚度越来越低,所以客户流失已经成为银行业最关注的问题之一。其实,银行流水数据反应了客户使用银行卡的行为特点,通过对这些数据进行深入分析,挖掘不同类别客户的特点,有针对性地进行营销,加强客户关系管理,提高客户与我行粘度,减少
  3. 电子表格⬝ 分组报表

    击“属性”设置单元格属性,切换到页签“其他”下,设置结果集筛选前3个。 image2022-3-1_14-35-4.png (2)选中单元格“D4”,其余操作同上,设置结果集筛选前2个。 表格样式 分别设置表格中分组区和数据区的填充色。 分组区背景色:选中单元格C4、D4、E4,设置填充色为#F2F2F2; 数据区背景色:选中单元格F4、G4,设置填充色为#FAFAFA; 标题 标题直接在电子表格中输入标题名称,设置字体、大小、颜色、居中对齐。 标题字体:黑体;字号:12;字体颜色:#203764; 完成以上定制后,保存即可。 资源下载 分组报表.xml
  4. 数据挖掘-预测

    概述 预测节点是根据训练集以及各种分类或回归算法对测试集进行结果预测。  输入/输出 输入 两个输入端口,左边输入为已训练的模型或者已保存的模型,右边输入为测试集。 输出 一个输出端口,输出测试集的预测结果。 示例 以逻辑回归为例,如下图:  图片41.png 点击预测节点右键可查看预测结果输出。 输出字段 输出字段 概念及其作用 features 特征向量,是由特征列组成的特征向量。 featuresNormalized 归一化后的特征向量,将特征向量进行归一化转换。 rawPrediction 直接概率,即每个可能标签置信度的度量
  5. 数据挖掘-正则化

    ,默认值为:2 示例 使用“鸢尾花数据”,选择4个特征列进行正则化处理,P范数为2,输出结果如下图: 图片15.png 正则化
  6. 数据挖掘-停用词处理

    _seg_words),填写停用词,输出结果如下图所示: 图片6.png 停用词处理
  7. 数据挖掘-主题-词分布(LDA)

    概述 主题-词分布(LDA)指的是LDA模型训练后输出的每个主题和每个主题输出的词及概率分布。 常用于做词云图分析。 参数设置 参数名称 说明 主题词数 每个主题输出的词数。 示例 使用文本数据,分析主题词分布情况以及各词的概率权重。主题-词分布(LDA)设置的参数每个主题输出的词数为8,输出结果如下: 图片8.png 其中topic0-5表示输出的5个主题的概率权重,termName表示输出的词,其中主题概率为0.0表示该主题所对应的词是没有的。termCode表示输出的词编码。 主题-词分布(lda)
  8. 绘制工具

    系统支持流程设计的工具包含如下四个: 图片37.png 工具的使用说明如下: 功能 说明 抓手工具 默认状态为抓手,长按右键可移动画布或节点位置。 抓手.gif 套索工具 类似于多选,当画布区中有多个节点时,可使用套索工具可选中多个节点组合进行移动。 套索.gif 空间工具 通过十字定位,将十字下方或右方的进行上下或左右移动。 使用方法:将十字线停留在需要整体移动对象组的左侧,点击鼠标不放并且拖动,即显示可左右或上下的箭头,表示可将右侧对象组进行左右或上下移动。如下所示: 套索工具使用.gif 全局链接 用于将两个流程节点以关系线连接。
  9. 数据挖掘-正则化

    ,默认值为:2 示例 使用“鸢尾花数据”,选择4个特征列进行正则化处理,P范数为2,输出结果如下图: 图片15.png 正则化
  10. 数据挖掘-模型批量预测

    概述 采用服务发布的方式将预测结果数据投放到生产,但是此方式一般只能处理小数据量的数据。模型批量预测可解决处理大数据量的数据。 模型批量预测跟服务发布的功能作用是类似的,主要是解决客户训练出来的模型对外输出预测结果的问题,其中“批量预测”主要是针对批量的数据;您可以通过模型批量预测定时调度训练好的模型DAG来将批量预测结果数据输入到目标表中。另外,Smartbi提供统一的模型批量预测监控界面,全方位帮助您观察预测任务的运行状态和作业调用记录。  lALPBG1Q7iURQTPNAoTNAwc_775_644.png 进入模型批量预测界面,可设置定时作业,如下:  图片6.png 模型批量预测