第101页,共308页。 显示 3,073 条结果 (0.033 秒)
数据挖掘-TF-IDF
概述 一种统计方法,TF意思是词频,IDF意思是逆文本频率指数,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 TF-IDF值越高,说明该词越重要。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 特征项数 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 必填 示例 图片3.png 效果 使用“垃圾短信识别”数据,选择Smartbi V10-数据挖掘
数据库 +【数据挖掘】数据预处理增加下采样节点 +【数据挖掘】新增SMOTE数据预处理方式 +【自助ETL/数据挖掘】数据预处理新增值替换节点 +【数据挖掘】特征工程新增GBDT特征选择节点 +【数据挖掘】统计分析支持高维数据可视化 +【数据挖掘】评分卡分析新增PSI评估节点 +【数据挖掘】文本分析增加 … /viewpage.action?pageId=65603238。 +【数据挖掘】新增Kafka数据源节点 背景介绍 Kafka是一种高吞吐量的分布式发布订阅消息系统,经常用于实时流数据架构,提供实时分析。它具有高吞吐量、低延迟,每秒可以处理几万条消息,延迟最低只有几毫秒,以及可扩展性、持久性子流程应用-信息采集审批 ⬝ 流程实现详情
1.定义组织结构 1、 创建如下角色并设置角色的操作权限: 角色 操作授权 总公司审批角色 数据连接模块; 数据准备模块; 分析展现>电子表格; 公共设置>流程。 发起人角色 数据连接模块; 数据准备模块; 分析展现>电子表格; 公共设置>流程。 北京分公司审批角色 分析展现>电子表格 广州分公司审批角色 分析展现>电子表格 北京填报角色 分析展现>电子表格 广州填报角色 分析展现>电子表格 2、创建如下3个用户组及6个用户,并且进行角色分配: 用户组 用户 所属角色 总公司 流程子流程应用-信息采集审批 ⬝ 流程实现详情
1.定义组织结构 1、 创建如下角色并设置角色的操作权限: 角色 操作授权 总公司审批角色 数据连接模块; 数据准备模块; 分析展现>电子表格; 公共设置>流程。 发起人角色 数据连接模块; 数据准备模块; 分析展现>电子表格; 公共设置>流程。 北京分公司审批角色 分析展现>电子表格 广州分公司审批角色 分析展现>电子表格 北京填报角色 分析展现>电子表格 广州填报角色 分析展现>电子表格 2、创建如下3个用户组及6个用户,并且进行角色分配: 用户组 用户 所属角色 总公司 流程创建筛选器组件
1 概述 仪表盘中可以通过筛选器组件动态筛选想要查看的数据,创建筛选器组件有以下两种方式:添加筛选器组件和拖拽字段快速生成筛选器组件。 2 场景示例 2.1 业务场景 以产品内置Demo资源的“订单模型”作为数据来源,在全国订单销售数据分析看板中,通过切换选择不同的年份和区域,查看对应数据。 jichugongn-chakanshuju.gif 2.2 添加筛选器组件 下面通过 多选下拉 和 年 筛选器类型演示筛选器组件的添加和使用过程。 1、已有全国订单销售数据分析看板效果如下图所示,看板中的图表组件创建示例可参考 创建第一个可视化组件 。 jichugongneng-01.png 2、增加区域筛选器时间计算-同期/前期累计
1 概述 统计表中常常以本年累计、上年同期(累计)、当期(例如当月)完成、上月完成为统计数据,并进行分析。 若分析区域维度栏包含 时间层次 字段,则支持的计算类型如下所示: 使用条件 支持计算内容 说明 分析区域维度栏包含时间层次 字段情况下使用。 累计值 当年累计:是指本年1月到截止月份的合计数 同期累计值 累计值的同期值 累计值同比 本期累计值 / 同期累计值 * 100% 累计值同比增长 本期累计值 - 同期累计值 累计值同比增长率 (本期累计值 / 同期累计值 - 1)* 100% 前期累计值 累计值的前期值企业微信集成
概述 企业微信是一款常用的企业通讯与办公工具,Smartbi支持与企业微信深度集成。只需要简单的配置,即可打通Smartbi与企业微信两个系统,实现在企业微信中便携访问数据和分析结果,营造企业数据分析文化氛围,促进数据驱动的决策。 企业微信集成功能,需通过企业微信扩展包实现。扩展包下载地址请参考:步骤1 Smartbi环境准备 业务价值 Smartbi与企业微信集成的业务价值,主要有: Smartbi作为企业微信的应用,用户在企业微信中即可直接访问Smartbi系统,无需切换多个系统,提高工作效率;可随时随地访问数据及分析结果,增强决策能力。 qw-01.png 用户可方便地推送、分享报表给他人,促进企业内部交流快速入门 ⬝ 界面介绍
如下: yshj.png 若登录私有部署的Smartbi服务器,主界面如下: 1.png 导航栏由主界面、搜索、新建、首页、语言、我的待办、消息中心、我的设置、用户操作几部分组成; 侧边栏由数据门户、应用、数据连接、数据准备、数据挖掘、分析展现、更多、答疑几个模块组成; 常用模块入口介绍如下表所示: 名称 界面 详情参考 数据连接 2.png 详情可参考文档数据连接快速入门(待更新) 数据准备 3.png 详情可参考文档数据准备快速入门(待更新) 分析展现 4.png 详情可参考文档分析展现快速入门 更多 资源发布 5.png 详情可SmartBI线下excle异构数据源数据源报表开发实现路径
(本文档仅供参考) 需求: 场景举例:目前数据模型有一个复杂SQL查询(带参数),需要关联一张线下EXCEL表,创建自助分析模型,给到用户即席or透视or仪表盘。 痛点: 1、模型处理异构表关联需要走抽取,抽取存在只能抽取参数默认值,故该方法不通 2、线下数据落到数仓,需要评估是否合规 3、自助ETL处理异构,流程比较复杂 解决方案: 目前在产品当中,要使用本地的Excel文件数据做分析, 1、通过文件数据源将数据导入到指定的数据库 2、通过ETL当中的功能将数据落地到数仓,然后Smartbi再通过数据模型进行处理 除此方法外,将本地Excel的数据导入到hive库当中,然后直连hive库中是数据表查数分析打开报表报错,日志信息报错为:Comparison method violates its general contract!
(本文档仅供参考) 问题说明 某些场景下,打开电子表格资源或透视分析资源会报错,对应的日志信息为:Comparison method violates its general contract! image2020-7-2 18:34:35.png 场景1: 在透视分析中使用分级降序,如下图所示 … image2022-12-13_9-54-45.png 场景3:仪表盘打开报错对象池错误 image2023-10-31_11-6-57.png 解决方案 此问题是由于在使用JDK1.7以及JDK1.7以上版本的环境下,电子表格或者透视分析资源在某些特定场景下存在兼容性问题导致的,需要通过添加jvm参数