第408页,共563页。 显示 5,621 条结果 (0.093 秒)
数据挖掘-文本分析
文本分析是对文字类型的数据进行处理的方法,即从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。 文本分析跳转规则宏示例
该目录下的示例效果需要通过编写宏代码实现,或者通过修改跳转规则向导生成的宏代码实现,适用于有一定相关技术水平的人员。数据挖掘-文本分析
文本分析是对文字类型的数据进行处理的方法,即从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。 文本分析跳转规则宏示例
该目录下的示例效果需要通过编写宏代码实现,或者通过修改跳转规则向导生成的宏代码实现,适用于有一定相关技术水平的人员。连接Oracle 11g/10g数据源
Oracle 11g/10g数据源是项目中使用比较多的一类数据库。 下面以具体的连接示例来说明如何使用Oracle 11g/10g作为业务库和知识库。 在Smartbi中连接Oracle 11g/10g数据源的说明如下: 1、Smartbi连接Oracle 11g/10g作为业务库 创建入口:在smartbi中选择 数据连接 > 关系数据库 > Oracle: 556.png 连接属性说明: 2022-02-15_15-02-37.png 连接字符串,有两种连接方式:sid和service_name;系统默认显示service_name连接格式。 注意:单实例数据库service_name和SID一样时需要基于高速缓存库查询报错查询超出最大内存限制
问题现象: 高速缓存库抽取的时候报错,抽取日志中显示超出内存最大限制14G大小,实际上仅2-3个模型进行并发的抽取,就会将内存全部占满。 image2024-7-27_17-34-22.png 问题原因: 按照数据模型抽取逻辑,产品会将维表和事实表单独抽取到高速缓存库中之后在高速缓存库中通过关联查询将所以的表汇总成大宽表,在关联查询的时候很可能因为数据量过大且并发的查询较多的情况下高速缓存库的内存就很有可能会出现不够用的情况。 解决方案: 主要可以从以下几个方面进行优化。 1、调整数据模型维表数据量 高速缓存库会先将表全部抽取之后再进行关联,当维表的数据量很多的时候,比如维表数据量50万,事实表数据量几百万计划任务跳过节假日执行
(本计划任务脚本仅供参考,实际应用效果需要自行根据实际场景进行代码调整。) 需求说明: 计划任务推送只在工作日执行,需要跳过周末、节假日。 实现思路: 因为法定节假日每年的具体日期存在差异,并且可能因为补班导致周末也是需要上班的,所以每年的工作日也是不固定的。 对于此需求,可以在数据库中维护一张日历表,并且有一列标记列,例如为0则代表节假日,为1则代表工作日,通过查询标记列的值,来判断是否要执行计划任务推送。 参考方案: 先创建一个日历表,手动维护节假日,例如下:ID为编号、date为日期、tag为标记列,来判断是否为工作日。 image2024-7-27_10-36-45.png 创建计划任务,定制代码如下电子表格单元格中使用计算公式,导出为excel文件不显示公式只显示计算结果
cell.setValue(value); //重新设置单元格值 } } 或者使用以下代码,则不需要指定单元格,又由于是直接扫所有单元格,数据量大了可能会慢 function main(spreadsheetReport) { var type数据模型不使用默认日期来分割月时间维度
(文档仅供参考) 需求背景: 数据模型由于本身查询的问题,只能固定每月的时间维度为每个月的最后一天,而有些时候月汇总的维度不会在每个月的最后一天,如果财务的截止计算周期在每月28日的时候,如3月29日-4月28日为一个月计算周期,当需月时间维度汇总的时候由于数据模型自动创建时间维度是以每月最后一天,就无法计算出正确的维度值。 解决方案: 按照实际的需求,可以将维度构建为如下形式,如将2023年12月29日的月时间维度归为2024年1月,年时间维度归为2024年来满足这个需求,具体操作方式如下: image2024-7-27_17-4-44.png 1、创建日期维表 image2024-7-27_17-9-4.png数据挖掘-机器学习
机器学习是一类算法的总称,这些算法从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类。它不需要写任何与问题有关的特定代码,将数据输入泛型算法当中,在数据的基础上建立对应的逻辑,输出期望的结果。 机器学习