搜索

Help

第96页,共149页。 显示 1,488 条结果 (0.026 秒)

  1. 如何在作业流成使用“检查依赖"字段节点

    的ETL通过比较系统时间与抽取源表的时间戳字段的值来决定抽取哪些数据。为了保证数据的准确,需要保证本月截止到现在,负责抽取任务的ETL每一天的运行都是正常的,才能执行接下来的统计分析本月截止到现在的销售情况ETL任务。此时,就可以使用“检查依赖”功能。 输入/输出 输入 一个输入端口,用于连接节点
  2. 桑基图

    维度间的相关,以流的形式表示同一类别不同层次的数据流量变化。 2) 表示物质的转化,通常应用于能源、材料成分、金融和网站用户流量等数据的可视化分析。 不适用场景:  不适用于起始流量和结束流量不同的数据。由于桑基图需要保持能量守恒,不能在中间过程创造出流量,流失(损耗)的流量应流向表示损耗的节点,所以主支宽度和
  3. 电子表格⬝ 表单报表

    报表简介 表单报表是业务应用比较强的一类报表,没有行列数据没有规律。 作用:用于数据录入、数据查询。 适用场景:适用数据录入、查询的情况。 报表结构:表单报表没有固定表结构,根据实际业务需要进行规划。 示例效果 下表是比较具有代表的一类表单报表: image2019-5-16 16:52:3.png 数据要求 该示例中,求职人员是通过单选的参数进行确定的,因此定义的数据集需要包含求职人的参数。 通过分析表样,我们发现求职人的家庭关系是当前表单中的一个子表,因此我们建议通过两个数据集来获取相关数据信息: 数据集分类 数据集设计 数据集效果 获取求职人的基本信息
  4. 阶梯线图/堆积阶梯线图

    区:1个或多个度量 颜色区:1个维度/1个度量 适用场景: 1)阶梯线图适合二维的大数据集,还适合多个二维数据集的比较。  2)  反映变化趋势,关联。  3)  堆积阶梯线图适合大数据集的趋势分析,尤其适合非离散型维度分析,比如时间,价格走势 。 示例 我们在业务分析中,经常会对趋势进行对比
  5. 数据挖掘-采样

    采样就是按照某种规则从数据集中挑选样本数据。 在Smartbi中支持五种类型的采样:随机采样、加权采样、分层采样、下采样、SMOTE。 概述 类型 说明 image2020-5-21 10:44:46.png 按照随机的原则,从总体数据中随机地抽取部分数据,保证总体样本中每一个样本都有已知的、非零的概率被选入为研究对象,以保证样本的代表。 image2020-5-21 10:44:18.png 以加权方式生成采样数据。先从总体中,选择用于加权的列,然后按照该列值的大小进行采样,权重值越大,抽取的概率越大。 image2020-5-21 10:42
  6. 数据挖掘-支持向量机

    概述 支持向量机,英文为Support Vector Machine,简称SVM。它是一种监督式学习的方法,它广泛的应用于统计分类分析中。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化。 支持向量机算法是以极大化类间间隔为目标,并以之作为最佳分类超平面,其中定义的类间间隔为两类样本到分类超平面的最小距离,通过引入松弛变量,使支持向量机能够解决类间重叠问题,并提高泛化能力。 它的主要优势为: 1)特征映射,有效区分。 2)约束求优,更加准确区分类别。 示例 使用“银行信用贷款预测
  7. 数据挖掘-随机森林

    概述 随机森林指的是利用多棵树构成森林对样本进行训练并预测的一种分类器。但是每棵决策树之间没有关联,每棵树都是基于随机抽取的样本和特征进行独立训练。 随机森林算法广泛应用于分类问题。其是决策树的组合,将许多决策树联合到一起,以降低过拟合的风险。随机森林支持连续数据或离散数据进行二分类或多分类。 优势:可反映出特征重要。 示例 使用“垃圾短信识别”案例数据,预测是否为垃圾短信。 image2020-6-5 16:22:21.png 其中,分词是为了将短信文本进行分成词语方便分析;停用词处理是为了去除不必要的词语、标点符号、语气词等;TF-IDF是为了计算文本数据的idf值,方便进入模型训练
  8. 自由布局-排列

    。 剪切组合 对组件组合进行剪切操作 复制组合 对组件组合进行复制操作 粘贴 将剪切/复制的组件组合在鼠标悬停的位置进行粘贴 锁定 锁定组件的大小和位置,鼠标无法拖拽修改。 组合 当需要对布局进行调整时,在自由布局中,使用组件组合可以减少配置的工作量、提高便捷和大屏制作效率
  9. 如何使用ETL的"Foreach 循环容器"节点?

    1、概述    读取文件数据主要有以下方式: 1)使用Excel导入模型:要根据模板导入,并且一次只能导入一个文件 2)数据源/ 加载文件数据: 一次只能导入一个文件 3)ETL的”FTP数据源"节点: 一次只能读取一个文件  而在V10.5.8版本中,支持一次批量读取多个excel文件数据并且合并成大宽表存储到指定表中,业务人员无需重复导入,提高了其工作效率。 2、场景举例     零售行业,店面可能分布在不同的国家、城市里,每个店面每个月都会生成一份Execl文件数据,到了月底客户把所有店面的文件收集起来,统一存放在一个文件夹中; 客户要求文件夹下所有文件的数据落地整合成一份数据,然后再用于可视化
  10. MySQL常用命令总结

    > test_db.sql 上述命令将 test 数据库备份到当前路径下的 test_db.sql 文件中。它一次备份了 test 库中的所有表,如果只需要备份某几张表,在库名后分别列出表命即可,表之间用空格分开。 该命令中 -h, -P, -u, -p 等参数的含义,请参考 登录数据库 部分的解释。   mysql -h
    技术参考十二月 19, 2014