搜索

Help

第65页,共308页。 显示 3,072 条结果 (0.05 秒)

  1. 某政府单位疫情期间网民情绪识别

    数据进行文本挖掘分析,本次数据挖掘建模的目标如下: 1、分析某一网民对疫情相关话题的情感倾向。 2、从微博内容挖掘出网民情绪积极与异常情绪缘由。 3、针对情绪消极用户指定对策进行舆情引导,防止情绪进一步恶化。 本次建模针对疫情期间网民关于疫情相关话题的微博中文内容,在对文本进行预处理、分词、停用词处理后,通过分类算法随机森林和LDA主题模型多种数据挖掘模型,实现对微博中文内容数据的情感倾向的判断以及所隐藏的信息的挖掘分析,以期望得到有价值的内在内容。 本案例的疫情期间网民情绪识别的总体流程如图1-1所示。 1.png 图1-1 1)获取数据,数据来源于赛题疫情期间网民情绪数据。 2)对获取的数据进行基本的处理操作
  2. 即席查询-注意事项

    数据来源为业务主题或数据源的即席查询可对参数、过滤器进行以下设置: 1、即席查询报表保存后不可切换数据源。 2、若使用自助数据集抽取到高速缓存库,基于高速缓存库创建创建即席查询,若需要基于高速缓存库创建分析并且使用自助数据集中创建的计算字段的话,在高速缓存库中要创建对应的计算字段 … “过滤器关系”面板如下: image2021-9-13_14-33-19.png 该面板主要通过以下操作实现对过滤器关系的调整: 通过拖动“过滤器”按钮改变组合方式; 双击“AND/OR”修改参数之间的组合关系; 过滤器关系.gif
  3. 计算节点的应用程序启动异常

    (本文档仅供参考) 问题现象: erl执行异常,查看日志提示:计算节点的应用程序启动异常,详情请看系统监控-实验监控-查看日志! image2024-3-15_11-7-1.png 分析过程: 1.先排查安装配置,保证挖掘引擎和服务引擎可以测试连接成功; 2.查看日志提示无法请求地址,一般要考虑主机名是否异常; image2024-3-15_11-13-59.png image2024-3-15_11-15-29.png image2024-3-15_11-15-52.png 解决方案: 1.主机名不能包含特殊符号,如@ . _等; 2.主机名也不能纯数字,需要数字和字母组合起来; 3.修改主机名请参考
    FAQ中心四月 01, 2024
  4. 数据挖掘 – LSH

    距离,LSH节点提供了两种距离度量:欧式距离和杰卡德距离。其中,欧式距离适用于绝大多数数据向量,而杰卡德距离适用于由0和1组成的向量(如,00101,10011等,非0的数值都会被视为1)。在文本分析问题中,可先使用词向量或TF-IDF把文本转换为数值型向量,再选用欧氏距离的LSH对向量进行哈希,哈希后的向量可用于相似度匹配。 输入/输出 输入 没有输入端口。 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 相似度计算方法 相似度距离度量 欧式距离和杰卡德距离 哈希存储桶的长度 每个哈希表内的哈希桶
  5. 数据挖掘-分词

    概述 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。它是对句子进行精确分词,在词库中进行搜索匹配,将句子根据匹配的结果分成那些常见的词组或者单词。常用于做文本挖掘分析。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分词后的结果。 参数设置 参数名称 说明 备注 字段选择 选择需要分词的字段列(必须是文本型字段) 必填 自定义词典 说明:按行填写词列表,每行一词,最多支持一万词。 支持两种方式输入自定义词: 手动输入,每行填写一个自定义词
  6. 数据挖掘 – LSH

    距离,LSH节点提供了两种距离度量:欧式距离和杰卡德距离。其中,欧式距离适用于绝大多数数据向量,而杰卡德距离适用于由0和1组成的向量(如,00101,10011等,非0的数值都会被视为1)。在文本分析问题中,可先使用词向量或TF-IDF把文本转换为数值型向量,再选用欧氏距离的LSH对向量进行哈希,哈希后的向量可用于相似度匹配。 输入/输出 输入 没有输入端口。 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 相似度计算方法 相似度距离度量 欧式距离和杰卡德距离 哈希存储桶的长度 每个哈希表内的哈希桶
  7. 数据挖掘-分词

    概述 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。它是对句子进行精确分词,在词库中进行搜索匹配,将句子根据匹配的结果分成那些常见的词组或者单词。常用于做文本挖掘分析。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分词后的结果。 参数设置 参数名称 说明 备注 字段选择 选择需要分词的字段列(必须是文本型字段) 必填 自定义词典 说明:按行填写词列表,每行一词,最多支持一万词。 支持两种方式输入自定义词: 手动输入,每行填写一个自定义词
  8. ETL高级查询-功能节点

    /viewpage.action?pageId=58101308 通过对少数样本的分析可以合成新的样本,是一种过采样技术。 拆分 https://wiki.smartbi.com.cn//pages/viewpage.action?pageId=51940554&src=contextnavpagetreemode 将原始样本集按照 … 数据集字段的组合后得到新的数据表。 行选择 https://wiki.smartbi.com.cn//pages/viewpage.action?pageId=51940617&src=contextnavpagetreemode 行选择是根据不同的筛选或者删除条件,选择不同数量的行。 去除重复值
  9. 系统运维

    ?pageId=46074513 索引记录了系统中各资源之间的关联关系,当资源的血统分析/影响性分析查看不到关联的资源,则可以重建索引,对系统资源之间的关联关系进行重新匹配,以便更好地进行资源搜索,查看各资源的依赖关系。 调试工具集 http://wiki.smartbi.com.cn:18081/pages … 对应用商店进行统一配置管理。 自然语言配置 对自然语言配置项的统一管理。 系统运维 模块下的配置卡片支持自由排列,用户可随意拖拽搭配适合自己常用习惯的排列组合方式。 7879A632-23DE-431C-B859-F287F098FFF8.GIF
  10. 电子表格根据参数值导出不同sheet

    该宏示例在 V10.5上 验证通过 提示:本文档的示例代码仅适用于本文档中的示例报表/场景。若实际报表/场景与示例代码无法完全适配(如报表使用冻结,或多个宏代码冲突等),需根据实际需求开发代码。 1、本示例表样要求:第一列数据是分组合并的,且该列所有行数据的集合是参数备选值集合的子集 … 如下: image2020-6-16 18:1:50.png 版本及客户端说明 1.smartbi版本:V9 2.客户端:PC 3.浏览器:IE11、谷歌浏览器(Chrome) 设置方法 1、首先在电子表格设计器(Microsoft Office Excel)中,创建电子表格报表。 2、在浏览器中,切换到“分析展现