封面
版权信息
内容简介
前言
第1章 大数据概述
1.1 从AlphaGo说起
1.2 大数据定义
1.3 大数据产生的原因
1.4 大数据发展历程
1.5 大数据的特征
1.6 数据的度量
1.7 大数据思维
- APP免费
1.8 科学研究范式的发展
- APP免费
1.9 大数据的影响及应用
- APP免费
1.10 大数据计算模式及产品
- APP免费
第2章 数据收集
- APP免费
2.1 外部数据收集
- APP免费
2.1.1 网络爬虫原理
- APP免费
2.1.2 搜索排序策略
- APP免费
2.1.3 Web网络图
- APP免费
2.1.4 构建爬虫系统
- APP免费
2.2 内部数据收集
- APP免费
2.2.1 Flume
- APP免费
2.2.2 Chukwa
- APP免费
第3章 数据存储
- APP免费
3.1 文件存储
- APP免费
3.1.1 Hadoop简介
- APP免费
3.1.2 HDFS设计原则
- APP免费
3.1.3 HDFS的基本术语
- APP免费
3.1.4 HDFS运行架构
- APP免费
3.1.5 HDFS安全设计
- APP免费
3.1.6 HDFS的弱点
- APP免费
3.2 数据库存储
- APP免费
3.2.1 NoSQL简介
- APP免费
3.2.2 列族数据库HBase
- APP免费
3.2.3 文档数据库MongoDB
- APP免费
3.2.4 图数据库
- APP免费
3.2.5 键-值对数据库
- APP免费
第4章 数据处理
- APP免费
4.1 离线批处理框架
- APP免费
4.2 MapReduce计算框架
- APP免费
4.3 Hadoop简介
- APP免费
4.3.1 Hadoop生态圈
- APP免费
4.3.2 Hadoop发展历程
- APP免费
4.3.3 Hadoop的特点
- APP免费
4.3.4 Hadoop的版本
- APP免费
4.4 HDFS高可用性架构
- APP免费
4.5 HDFS联邦
- APP免费
4.6 YARN
- APP免费
4.7 Hadoop工具集
- APP免费
4.8 消息机制
- APP免费
4.8.1 消息处理模型
- APP免费
4.8.2 JMS
- APP免费
4.9 内存计算框架Spark
- APP免费
4.9.1 Spark的配置方式
- APP免费
4.9.2 Spark的主要特点
- APP免费
4.9.3 Spark生态圈
- APP免费
4.9.4 Spark与Hadoop比较
- APP免费
4.9.5 Spark运行架构
- APP免费
4.9.6 Spark基本运行流程
- APP免费
4.9.7 RDD
- APP免费
4.10 流式计算框架
- APP免费
4.10.1 流式计算处理过程
- APP免费
4.10.2 常见的流式计算软件
- APP免费
4.10.3 Storm系统
- APP免费
4.10.4 Spark Streaming
- APP免费
4.10.5 流计算与批处理计算的区别
- APP免费
4.11 图计算
- APP免费
4.11.1 Pregel图计算框架的提出
- APP免费
4.11.2 超步
- APP免费
4.11.3 Pregel计算模型
- APP免费
4.11.4 Pregel的C++ API
- APP免费
4.11.5 Pregel体系结构
- APP免费
4.11.6 容错性
- APP免费
第5章 数据可视化
- APP免费
5.1 数据可视化定义
- APP免费
5.2 数据可视化发展历程
- APP免费
5.3 数据可视化的作用
- APP免费
5.4 数据可视化设计步骤
- APP免费
5.5 数据可视化设计要素
- APP免费
5.6 颜色可视化设计
- APP免费
5.6.1 色彩空间
- APP免费
5.6.2 色彩三要素
- APP免费
5.7 数据可视化基本图形选用
- APP免费
5.8 数据可视化工具
- APP免费
第6章 信息检索
- APP免费
6.1 信息检索定义
- APP免费
6.2 相关性
- APP免费
6.2.1 布尔模型
- APP免费
6.2.2 排序布尔模型
- APP免费
6.2.3 向量空间模型
- APP免费
6.2.4 语言模型
- APP免费
6.3 及时性
- APP免费
6.4 搜索引擎
- APP免费
6.4.1 网页链接分析法
- APP免费
6.4.2 电子商务中的商品排序
- APP免费
6.4.3 开源搜索引擎
- APP免费
6.5 推荐系统
- APP免费
6.5.1 何谓推荐系统
- APP免费
6.5.2 推荐系统与电商
- APP免费
6.5.3 推荐系统数据基础
- APP免费
6.5.4 推荐方法
- APP免费
6.5.5 开源推荐系统
- APP免费
6.6 互联网广告
- APP免费
第7章 数据挖掘
- APP免费
7.1 基本概念
- APP免费
7.1.1 数据挖掘的定义
- APP免费
7.1.2 相关技术
- APP免费
7.2 数据来源
- APP免费
7.3 数据表示与预处理
- APP免费
7.4 机器学习算法
- APP免费
7.4.1 关联分析
- APP免费
7.4.2 分类
- APP免费
7.4.3 回归分析算法
- APP免费
7.4.4 聚类分析
- APP免费
7.5 数据挖掘工具软件
- APP免费
第8章 效能评估
- APP免费
8.1 效果评估
- APP免费
8.1.1 对信息检索的评估
- APP免费
8.1.2 对分类的评估
- APP免费
8.1.3 对聚类的评估
- APP免费
8.2 性能评估
- APP免费
附录 Hadoop编年史
- APP免费
参考文献
- APP免费
反侵权盗版声明
更新时间:2024-01-08 16:14:31