大数据经典论文
- GFS: The Google File System. ACM SOSP’03
- MapReduce:Google App Engine: MapReduce
- BigTable:A Distributed Storage System for Structured Data
- Dremel:Interactive Analysis of Web-Scale Datasets
- Hadoop:Apache Hadoop, Treasure Data Hadoop
大数据经典工具平台
- 基础层 – 云计算:Amazon EMR、OpenStack、Google App Engine、Treasure Data Hadoop
- 管理层 -NoSQL:Hbase、MongoDB、Redis
- 管理层 -NewSQL:Google Spanner、Amazon RDS、SQL Azure、Database.com、Xeround、FathomDB、Akiban、TransLattice
- 管理层 -MapReduce:Hadoop、Mahout、Hive、Pig
- 管理层 -MPP:Greenplum
- 管理层 -流数据:Storm、S4、Esper
- 分析层 – 数据分析与可视化:Cetas、Excel、iWork Numbers、Google Spreadsheets、Flash/ActionScript、Processing、R、D3.js
参考书目

数据挖掘:概念与技术(原书第3版)

大数据与数据挖掘参考书目 201407