第61页,共308页。 显示 3,072 条结果 (0.036 秒)
数据挖掘-线性回归
概述 一种常用的回归方法,它是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计方法,通过凸优化的方法进行求解,以达到预测评估的效果。 示例 使用“波士顿房价预测”案例数据,预测波士顿房价。 图片35.png 其中,相关性分析是为了分析特征变量与目标变量的相关性 … 。 标准化 最小最大值归一化 最大绝对值归一化 自动调参设置 系统默认的各项参数值范围。 必须结合“启用自动调参”功能使用。系统将对设置指定或范围内的参数值循环调参,匹配出最优的组合。详情请参考 。 启用自动调参: 勾选该项,则系统自动调参数,不需要用户手工产品介绍
明细数据的查询,只需通过简单的鼠标勾选数据字段与查询条件,便可快速获得所需数据,并提供聚合计算、告警规则、重定义表关系、改变条件组合逻辑等高级功能。 透视分析 透视分析功能支持业务用户任意拖拽字段作为输出字段或筛选条件对数据实现分析,支持对数据进行切片、钻取、汇总、预警等,还可以根据业务属性设置时间计算 … 1、产品概述 广州思迈特软件有限公司的核心产品 “思迈特商业智能与大数据分析软件”(以下简称:“Smartbi”)是企业级商业智能和大数据分析平台。 经过多年的持续发展,凝聚了商业智能最佳实践经验,整合了各行业的数据分析和决策支持的功能需求,满足最终用户在企业级报表、数据可视化分析、自助探索分析、数据挖掘设置查询关系 ⬝ 设置查询关系 ⬝ 双向筛选介绍
双向筛选本质要解决的是数据多维度分析。 本文面向使用Smartbi 的数据建模者,它指导你何时创建双向模型关系。 1、本文不涵盖对模型关系的介绍。 如果你对模型关系、其属性或配置方法并非完全熟悉,建议先阅读 设置查询关系 一文。 2、此外,还应了解星型架构设计,这一点也很重要。 有关详细信息,请参阅星型架构 … 数据)。 如果创建多个潜在的查询路径,可能会无意中造成歧义,若要避免这两个问题,请规划使用单向和双向筛选器的组合。 建议尽量减少使用双向关系, 此类关系可能会对数据模型查询性能产生负面影响。 双向筛选可以满足特定要求的场景有以下三种: 同步筛选器值 1 特殊模型关系 在创建以下特殊模型BI笔记之---BI通用流程
aspnetx_2.jpg 此图是根据个人经验总结出的一个BI通用流程,适用于报表方案,多维分析方案,但不适用于数据挖掘的方案。 BI项目关键资源:业务专家,BI开发人员,业务开发人员。 业务专家的参与有助于提高需求的准确性,BI开发人员主要负责BI过程相关资源的组织和管理,业务开发人员配合BI开发人员确认数据 … 都要沉淀下来并且形成文档。 反向确认数据仓库结构,手动或者系统自动均可,自动生成来说SQLServer从2005就已经支持了,不过为了命名规范,还是手动来生成数据仓库比较有必要。 分析数据来源及SSIS开发。最好是由相关模块的开发人员参与,因为开发人员是对数据结构比较了解的,并且有SQL功底,而且还掌握业务。这一步数据挖掘-FP-Growth
生活中的数据本身包含着各种联系,大数据的出现给我们带来了一种新的思维方式,那就是跳出先因后果的思维方式,用大量的数据统计结果去倒推原因,找到无关因素间的隐蔽联系,例如众人皆知的营销案例 "啤酒和尿布”。本文将介绍目前业界经典关联规则算法 FP-Growth,借助分析购物篮中商品数据,找出商品之间的关联 … 采用高级的数据结构,使其在大数据集上处理效率显著优于其他算法(Apriori),从而加快整个数据挖掘的过程。 应用场景 关联规则的挖掘算法,典型应用是零售业的购物篮分析,挖掘交易数据中的伴随购买、购买推荐关系链等商机,有助于制定营销策略。 应用案例 (1)我们可以基于产品内置的购物清单数据,针对购物篮商品利用数据挖掘-FP-Growth
生活中的数据本身包含着各种联系,大数据的出现给我们带来了一种新的思维方式,那就是跳出先因后果的思维方式,用大量的数据统计结果去倒推原因,找到无关因素间的隐蔽联系,例如众人皆知的营销案例 "啤酒和尿布”。本文将介绍目前业界经典关联规则算法 FP-Growth,借助分析购物篮中商品数据,找出商品之间的关联 … 采用高级的数据结构,使其在大数据集上处理效率显著优于其他算法(Apriori),从而加快整个数据挖掘的过程。 应用场景 关联规则的挖掘算法,典型应用是零售业的购物篮分析,挖掘交易数据中的伴随购买、购买推荐关系链等商机,有助于制定营销策略。 应用案例 (1)我们可以基于产品内置的购物清单数据,针对购物篮商品利用即席查询 ⬝ 过滤数据
。 image2024-5-14_16-4-27.png 过滤数据找到最终需要的数据,然后可以作明细查询的清单表效果,作设置样式。 3 条件组合关系 条件组合关系是基于数据模型引擎V2.0开发的,需要先开启数据模型引擎V2.0才能正常使用。 即席查询支持自定义多个筛选条件间的且/或逻辑关系,让业务人员无需编程、可通过简单拖拽设置“且(AND)”或“或(OR)”的组合条件,灵活筛选数据,快速解锁业务洞察,提升决策效率。 例如:以产品内置的 订单模型 为例,用户可能希望查询“2013年华南区域” 或者“2024年华北区域”的数据。 具体操作步骤如下: 1、打开即席查询,选择数据模型"订单模型",然后勾选 ”年“、”发货区域“、”销售额图表组件 ⬝ 热力图
1 概述 热力图是指用 【X轴】 和 【Y轴】 表示的 两个分类字段 确定数值点的位置,通过相应位置的 矩形颜色 去表现数值的大小,颜色深代表的数值大。 2 业务场景 (1)应用场景描述:热力图主要用于展示连续型数据的分布情况。例如用颜色展现某一范围内不同地区数据量的差异,网站分析等等。 分析不同时间各类产品的销售量; 分析公司各个发货区域产品销售额的差异。如下图所示: reli04.png (2)维度和度量要求 维度 度量 说明 2个 1个 两个分类轴,一个指标轴,分类轴的数据量不宜太少。 (3)图表的用途及特点 优势:好看、易于理解,数据信息更直观有效。 劣势交叉表组件
集时: 列区或行区必须与汇总区结合使用才可以展现数据,且通常列区或行区使用“维度”,汇总区使用“度量”;详情可参考:交叉表组件-基于业务主题/自助数据集。 当交叉表来源于数据模型时: 系统会在数据区自动虚拟出”度量名称+度量值”的组合,用来对度量字段在交叉表中不同位置进行处理;交叉表组件-基于数据模型 … /viewpage.action?pageId=89037201; 筛选排序:如需了解筛选排序功能,可参考文档仪表盘-筛选排序 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=83700761; 表格分析能力:如需了解表交互相关功能,可参考文档仪表盘-表格分析能力交互式仪表盘 ⬝ 选择及处理数据
1 概述 数据选择区展示了业务数据集中可供选择的维度、度量、命名集和参数,用户可通过勾选、拖拽添加已有字段,或自定义新的数据字段进行数据分析。 Snipaste_2023-05-22_18-06-25.png 2 选择和切换业务数据集 在进行数据分析前,可根据实际业务场景选择合适的业务数据集。 2.1 选择 … ”仅和“产品表”维度有关系,和顾客、发货区域、订单等维度没有关系。若没有如下图的维度和度量关系表,用户想要分析各产品当前的库存情况时,容易选择到无关联的维度,导致查询出来的数据全部相同,大大增加了分析数据的难度。 Snipaste_2023-05-23_13-51-56.png 2、此时可以选择开启维度和度量之间