大数据分析 - 汇总数据
-
简述
报告在大数据分析中非常重要。每个组织都必须定期提供信息以支持其决策过程。此任务通常由具有 SQL 和 ETL(提取、传输和加载)经验的数据分析师处理。负责这项任务的团队负责将大数据分析部门产生的信息传播到组织的不同领域。以下示例演示了数据汇总的含义。导航到文件夹bda/part1/summarize_data并在文件夹内,打开summarize_data.Rproj双击文件。然后,打开summarize_data.R脚本并查看代码,并按照提供的说明进行操作。ggplot2包非常适合数据可视化。data.table包是在R. 最近的一项基准测试表明它甚至比pandas,用于类似任务的python库。使用以下代码查看数据。此代码也可在bda/part1/summarize_data/summarize_data.Rproj文件。下面的代码有一个数据汇总的例子。