第162页,共316页。 显示 3,158 条结果 (0.06 秒)
数据挖掘-LDA
概述 LDA是一种主题模型。它是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。 它是一种非监督机器学习技术,可以识别出大规模文档集或语料库中的主题。 常用于做文本挖掘聚类分析。 参数设置 参数名称 说明 主题数目 主题数,或者聚类中心数。默认值为2。 迭代次数 模型的迭代次数,达到该迭代次数即退出。默认值为10 文档主题分布 文章分布的超参数(Dirichlet分布的参数),必需>=0,默认值为1。 值越大,推断出的分布越平滑 主题词分布 主题分布的超参数(Dirichlet分布的参数),必需>=0,默认值为1【升级实操】V8.5➜V10.1
Smartbi 从 V8.5 版本升级到 V10.1 版本,其升级内容如下: 组件 V8.5版本 V10.1版本 更新内容 备注 Smartbi √ √ Smartbi版本升级到 V10.1 Smartbi-OLAP-Server × √ 新增组件Smartbi-OLAP-Server 高速缓存库 √ √ 必须部署组件 V10.1 不支持Infobright,需要更换为 SmartbiMPP 数据挖掘 × √ 新增数据挖掘组件 在对生产环境进行正式的版本升级前,请先参考文档【升级前必备工作】V8.5➜V10.1 将前期必须准备的工作参数值控制查询字段
在Smartbi中,参数不仅只用于SQL的Where部分作为数据过滤,还可以用于Select部分,用于控制数据集的输出字段。 本示例演示通过勾选参数值内容,控制报表的输出字段。 实现步骤 1、新建参数 新建一个平铺勾选面板参数,设置参数的数据类型为“其他类型”。也可以设置控件类型为下拉框、对话框等。 image2019-11-12 15:47:9.png 2、参数的备选值设置 这里用静态列表方式。注意: 真实值必须为数据库中的字段名称。 所有字段必须来自于同一个表,这里不支持跨表查询。 image2021-8-28_17-32-15.png 3、新建原生SQL数据集 数据集内容为“select 参数参数值控制查询条件
在Smartbi中,参数不仅只用于SQL的Where部分作为数据过滤,还可以用于条件过滤。比如客户类型参数,选择值“达标”时,条件可能是balance>1000,选择“不达标"时,条件可能是balance<100,不排除大于小于范围 本示例演示通过勾选参数值内容,控制where 语句的限制条件。 实现步骤 1、新建参数 新建参数,注意设置参数的数据类型为“其他类型”。可以设置控件类型为下拉框、对话框等。 image2019-11-25 11:13:20.png 2、参数的备选值设置 这里用静态列表方式。注意:真实值必须为数据库中的条件表达式。 image2021-8-28_17-34-50.png 3、新建原生扩展设置-数据处理类
应用场景 数据处理类的应用场景是,在每行数据导入之后,根据导入结果,对其他数据库表或者文件进行操作。 实现步骤 1、参考插件开发指南和 Excel数据导入完整教程 中的演示绑定自定义java类的导入模板,实现该类,并编译生成扩展包。 2、参考扩展包部署,部署该扩展包。 3、新建Excel导入模板,进行基本设置及列设置。 image2021-6-2_18-22-11.png image2021-6-2_18-22-18.png 4、切换到"扩展设置",输入实现的数据处理类名称并保存。 image2021-7-20_13-47-51.png 附录 数据处理类代码: package smartbi.ext导入Excel数据
时会提示“下载异常数据失败,原因:模板文件不存在,请编辑模板,上传模板文件”。 则需要重新配置导入模板,上传Excel文件,并在“异常数据日志管理”重新导出异常数据。 wiki6.png 如果数据库字段信息发生变化,需编辑进入模板,在进行保存。工具栏
对新建或修改的可视化数据集进行预览。 查看SQL 查看该“数据集”的SQL语句。 显示评估的执行计划 解析执行计划,即数据库返回执行这个SQL需要花费哪些步骤 数据抽取 用于将当前数据集的数据抽取到MPP。 创建 可基于当前数据集快速创建透视分析、仪表分析、灵活【升级实操】V8.5➜V10.5
Smartbi 从 V8.5 版本升级到 V10.5 版本,其升级内容如下: 组件 V8.5版本 V10.5版本 更新内容 备注 Smartbi √ √ Smartbi版本升级到 V10.5 Smartbi-OLAP-Server × √ 新增组件Smartbi-OLAP-Server 高速缓存库 √ √ 必须部署组件 V10.5 不支持Infobright,需要更换为 SmartbiMPP 或者 SmartbiMPPMD 数据挖掘 × √ 新增数据挖掘组件 在对生产环境进行正式的版本升级前,请先参考文档【升级前必备工作】V8.5数据挖掘-LDA
概述 LDA是一种主题模型。它是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。 它是一种非监督机器学习技术,可以识别出大规模文档集或语料库中的主题。 常用于做文本挖掘聚类分析。 参数设置 参数名称 说明 主题数目 主题数,或者聚类中心数。默认值为2。 迭代次数 模型的迭代次数,达到该迭代次数即退出。默认值为10 文档主题分布 文章分布的超参数(Dirichlet分布的参数),必需>=0,默认值为1。 值越大,推断出的分布越平滑 主题词分布 主题分布的超参数(Dirichlet分布的参数),必需>=0,默认值为1支持直接定义SQL语句吗?定制SQL语句需要注意什么?
说明 可以通过 SQL查询 来直接定义SQL语句。直接用SQL查询不需要定义对象以及关系等,只需定义数据源和参数。 操作入口:定制 > 数据集定义 > 新建SQL查询。 注意 SQL查询可以使用的资源:表/视图、字段、参数、函数、用户属性(使用时请用括号括起来) 编写SQL查询时,支持拖动"参数"、"用户属性"、"系统函数"等对象,其他的建议手写; 不支持Select * from .....的写法; 如果有多条语句,用分号和回车隔开; 所有的Select字段需要显式给定一个别名,例如:select T1.fieldA FA from table T1。 对字段进行重命名时,注意各种数据库使用方式跟