大数据处理框架Apache Spark设计与实现最新章节全文无弹窗在线阅读-QQ阅读仙侠女生网

QQ阅读女频青春网

女频青春网

达人推广书架浏览历史

登录 | 注册

书籍简介

近年来，以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心，总结了大数据处理框架的基础知识、核心理论、典型的Spark应用，以及相关的性能和可靠性问题。本书分9章，主要包含四部分内容。第一部分大数据处理框架的基础知识（第1～2章）：介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作，并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分Spark大数据处理框架的核心理论（第3～4章）：介绍Spark框架将应用程序转化为逻辑处理流程，进而转化为可并行执行的物理执行计划的一般过程及方法。第三部分典型的Spark应用（第5章）：介绍迭代型的Spark机器学习应用和图计算应用。第四部分大数据处理框架性能和可靠性保障机制（第6～9章）：介绍Spark框架的Shuffle机制、数据缓存机制、错误容忍机制、内存管理机制等。

上架时间：2020-07-01 00:00:00

出版社：电子工业出版社

上海阅文信息技术有限公司已经获得合法授权，并进行制作发行

最新章节

许利杰等

同类热门书

最新上架

会员
数据要素五论：信息、权属、价值、安全、交易
本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发，汇聚不同学科背景的既有文献，整合现有观点，对数据要素的多维特性进行探讨，以丰富人们对数据要素的认知，凝聚共识，澄清数字时代的发展与治理迷思，为未来的相关创新提供起点。
张平文邱泽奇编著计算机14.5万字
会员
码上行动：利用Python与ChatGPT高效搞定Excel数据分析
本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析，以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。
袁昕编著计算机8.5万字
会员
Power BI商业数据分析完全自学教程
本书共5篇，分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇（第1-3章），主要针对初学者，从零开始，系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇（第4-6章），介绍了PowerBI数据的整理操作、表格中行/列数据的管理，以及PowerBI数据的高级处理、M函数的使
凤凰高新教育编著计算机0字
会员
商业分析思维与实践：用数据分析解决商业问题
本书本书基于业务问题，就如何搭建分析框架，厘清分析思路，按照标准分析步骤对数据进行怡当的预处理，选择合适的分析方法和分析模型，使用恰当的分析工具对数据进行分析，以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解，帮助业务专家做出合适的业务判断，制定准确的业务策略。
傅一行计算机13万字
会员
ETL数据整合与处理（Kettle）
本书以Kettle实现ETL流程为目标，将ETL知识点与任务相结合，配套真实案例，深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章，第1章介绍了ETL概念和ETL工具，让读者在了解ETL相关的概念后，立刻上手ETL工具Kettle；第2~6章介绍了Kettle工具转换相关的组件，包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容，内容与ETL流程匹配，能帮助读者快速掌握ETL
王雪松张良均主编计算机8.1万字
会员
数据产品开发与经营：从数据资源到数据资本
本书全面介绍数据产品开发与经营，全书共13章，分为数据产品基础、数据产品开发、数据产品实践、数据产品经营四篇。第一篇深入分析国家和地方层面的数据资产政策，提出数据资产运营框架，并介绍数据资源的治理和数据产品。第二篇详细阐述数据产品开发三大策略、数据产品设计五步法、数据产品开发方法以及数据产品运营方法。第三篇全面介绍数据产品开发的实践案例，特别从数据要素型企业、数商型企业两个角度说明数据产品开发的实
钱勇项灵刚林建兴于冰冰等计算机33.6万字
会员
算法设计与分析
为了便于读者进行系统学习、分类整理知识点及遇到问题时能够快速找到求解的方法，本书按照算法策略进行划分，每一章都引入了若干个经典问题。通过问题的分析、计算模型的建立、算法的设计与描述、算法的分析来深入解读每一种算法策略所能解决的问题范畴及方法。全书共分9章，内容包括：算法设计基础、算法效率分析基础、迭代法、蛮力法、分治策略、回溯与分支界限、贪心算法、动态规划、随机算法。本书非常注重教材的可读性和实用
张小东主编计算机9.4万字
会员
云计算服务保障体系
云计算是一种商业计算模型，它将计算任务分布在大量计算机构成的资源池上，使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同，云计算环境下，信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构，安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型；服务
林果园计算机9.5万字
会员
数据挖掘算法实践与案例详解
数据挖掘算法为大数据与人工智能的核心，掌握数据挖掘各算法的编程实现，有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现，同时，本书以多个经典的数据挖掘赛题为案例，详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现，有助于提升读者面对实际数据问题时灵活运用各类算法能力。
丁兆云沈大勇徐伟周鋆计算机4.7万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 pin.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015