功能覆盖数据分析全流程,一站式平台,产品功能可组合! 申请试用
根据Worldometer网站最新统计数据,截至北京时间4月12日23时,全球新冠肺炎确诊病例已达1803633例,死亡110835例。
全球疫情如何能更直观的查看?
必不可少的工具就是数据可视化了。下面是截止到4月5日制作的仪表盘看板供大家参考。
我们在查看数据可视化之前先了解一下数据分析。
完整的数据分析主要包括了六大步骤,它们依次为:分析设计、数据收集、数据处理、数据分析、数据展现、报告撰写等,所以也叫数据分析六步曲。
01
分析设计
首先要明确数据分析目的以及确定分析思路。
国内疫情基本控制,国际疫情爆发期,大家关注的热点转移到了国际.疫情控制要打好外防内控组合拳。本次新冠疫情可视化思路为国际疫情查看以及国内输入病例分布等。
02
数据收集
数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供了素材和依据。
这里的数据包括一手数据与二手数据,一手数据主要指可直接获取的数据,如公司内部的数据库、市场调查取得的数据等;二手数据主要指经过加工整理后得到的数据,如统计局在互联网上发布的数据、公开出版物中的数据等。
本次数据来自于网络国内公开数据。字段有国家、日期、确诊病例、死亡病例、治愈病例。以及各国内输入病例数据城市、输入病例数量。
03
数据处理
数据处理是指对采集到的数据进行加工整理,形成适合数据分析的样式,保证数据的一致性和有效性。它是数据分析前必不可少的阶段。
数据处理主要包括数据清洗、数据转化、数据抽取、数据合并、数据计算等处理方法。一般的数据都需要进行一定的处理才能用于后续的数据分析工作,即使再“干净”的原始数据也需要先进行一定的处理才能使用。
这里我们进行了哪些数据处理呢?
首先:增加了数据计算字段:死亡率=死亡病例/确诊病例(累计);治愈率=治愈病例/确诊病例(累计)。
再一个是:各国国家发现病例的时间不同,我们无法很好的同期比较,这里我们选取疫情TOP国家,以病例超过100例那天同设定为起始第一天。
04
数据分析
数据分析是指用适当的分析方法及工具,对收集来的数据进行分析,提取有价值的信息,形成有效结论的过程。这个就是我们数据探索,形式分析思路的过程。
✦ 首先:绝对值--查看最基础疫情情况
全球疫情分布、全球疫情TOP国家具体数据。
✦ 相对值--查看最基础疫情控制发展情况
治愈率与死亡率:TOP国家分布情况来相对查看各国疫情控制情况;治愈率与死亡率具体数据。
✦ 趋势值--查看最基础疫情发展情况
全球疫情随时间确诊数量变化情况
✦ 同期值--对比查看各国疫情发展情况
将疫情超过100例为数据对比的第一天(折线图)
✦ 构成分析:全球疫情对中国影响输入病例分布。
05
数据展现
通过数据分析,隐藏在数据内部的关系和规律就会逐渐浮现出来,那么通过什么方式展现出这些关系和规律,才能让别人一目了然呢?一般情况下,数据是通过表格和图形的方式来呈现的,即用图表说话。
多数情况下,人们更愿意接受图形这种数据展现方式,因为它能更加有效、直观地传递出分析师所要表达的观点。一般情况下,能用图说明问题的,就不用表格,能用表格说明问题的,就不用文字。
图形的种类很多,我们如何更好的选择呢?这里给出大家一个指导建议。
比较:目标比较、项目间比较、地域间数据比较;
序列:连续、有序类别的数据波动、各阶段递减过程;
构成:占比构成、多类别部分到整体、各成分分布构成;
描述:关键指标、数据分组差异、数据分散、数据相关性、人物或事物之间关系。
大家可以参考一下上面的分析思路和仪表盘来分析一下我们图形选择是否准确?或者是否还有更好的展示形式呢?
06
报告撰写
数据分析报告其实是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,以供决策者参考。所以数据分析报告是通过对数据全方位的科学分析来评估企业运营质量,为决策者提供科学、严谨的决策依据,以降低企业运营风险,提高企业核心竞争力。
起始这篇文章部分内容就是报告撰写的内容哦。小伙伴们可以自动手操作,通过上传自己整理的数据完成整改数据分析展现的过程哦。
本次我们使用Smartbi自助分析功能:体验环境为Smartbi官网体验中心。
更聪明的大数据分析软件,快速挖掘企业数据价值!
电话:
邮箱: