概要说明
词云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据,能快速感知最突出的文字。
如下是热门搜索城市词云图。
优势:酷炫、直观的图表,可以从大量的词中一眼抓住关键词。
劣势:使用场景单一,一般用来做词频。
数据要求:一个或两个维度,一个度量。所需数据量需要稍大些,数据的区分度也需要比较大,否则效果不明显,并且不适合要求准确的分析。
适用场景:显示词频,可以用来做一些用户画像、用户标签的工作。可以用来分析话题热度,如微博热搜榜。
不适用场景:除词频外的其他分析。
实现方案
业务情景描述:查看热门搜索城市。
数据结构
以上业务情景的数据来源如下:
我们的基础数据以明细表的形式存储,以上“权重”是通过输入的数据系统自动汇总统计的得出的。
定制要点
1、双击“城市”、“权重”字段,由系统自动分配维度到“标签”标记项、分配度量到“大小”标记项,得到如下词云图:
2、添加“颜色”标记项(可选,建议执行此操作,图表示内容更清晰),拖拽“城市”字段到“颜色”标记项,系统以颜色区分话题。
从上图可以看出深圳、广州、上海搜索热度最高。
度量计算
来源于自助数据集/业务主题的自助仪表盘可通过单击度量字段,对表中的度量指标进行合计、最大值、最小值、平均值、计数、唯一计数等计算;详情可参考文档度量计算-基于自助数据集/业务主题。
来源于数据模型的自助仪表盘则需返回数据模型界面进行设置;详情可参考文档度量计算-基于数据模型。
快速计算
来源于数据模型的自助仪表盘,可对表中的度量指标进行占比、排名、同比、同期值、环比、前期值等计算;详情可参考文档快速计算
词云图注意事项
(1)自助仪表盘如需使用“自助数据集”,需更换包含"自助数据集”的License文件
(2)若无法在自助仪表盘中使用业务主题,需前往系统选项>高级设置 中添加"DISABLE_BUSINESS_THEME_IN_DASHBOARD=false"