共享资源

大数据经典论文

  • GFS: The Google File System. ACM SOSP’03
  • MapReduce:Google App Engine: MapReduce
  • BigTable:A Distributed Storage System for Structured Data
  • Dremel:Interactive Analysis of Web-Scale Datasets
  • Hadoop:Apache Hadoop, Treasure Data Hadoop

大数据经典工具平台

  • 基础层 – 云计算:Amazon EMR、OpenStack、Google App Engine、Treasure Data Hadoop
  • 管理层 -NoSQL:Hbase、MongoDB、Redis
  • 管理层 -NewSQL:Google Spanner、Amazon RDS、SQL Azure、Database.com、Xeround、FathomDB、Akiban、TransLattice
  • 管理层 -MapReduce:Hadoop、Mahout、Hive、Pig
  • 管理层 -MPP:Greenplum
  • 管理层 -流数据:Storm、S4、Esper
  • 分析层 – 数据分析与可视化:Cetas、Excel、iWork Numbers、Google Spreadsheets、Flash/ActionScript、Processing、R、D3.js

参考书目

数据挖掘:概念与技术(原书第3版)

数据挖掘:概念与技术(原书第3版)

大数据与数据挖掘参考书目 201407

大数据与数据挖掘参考书目 201407