
会员
Python网络爬虫从入门到精通
更新时间:2022-07-28 19:48:06 最新章节:19.11 小结
书籍简介
《Python网络爬虫从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python实现网络爬虫开发应该掌握的技术。全书共分19章,内容包括初识网络爬虫、了解Web前端、请求模块urllib、请求模块urllib3、请求模块requests、高级网络请求模块、正则表达式、XPath解析、解析数据的BeautifulSoup、爬取动态渲染的信息、多线程与多进程爬虫、数据处理、数据存储、数据可视化、App抓包工具、识别验证码、Scrapy爬虫框架、Scrapy_Redis分布式爬虫、数据侦探。书中所有知识都结合具体实例进行介绍,涉及的程序代码给出了详细的注释,读者可轻松领会网络爬虫程序开发的精髓,快速提高开发技能。
品牌:清华大学
上架时间:2021-06-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
明日科技编著
同类热门书
最新上架
- 会员本书从网页开发的基础知识HTML5、CSS、JavaScript开始,以项目实战的方式介绍如何构建自适应网页,并通过工具免费发布自己的网站。在后面的章节中,以主流的3D框架ThreeJS为技术支撑,在网页中编写JavaScript代码,让读者构建完整的3D应用场景。计算机0字
- 会员本书分别讲解了大模型基础,数据集的加载、基本处理和制作,数据集的预处理,卷积神经网络模型,循环神经网络模型,特征提取,注意力机制,模型训练与调优,模型推理和评估,大模型优化算法和技术,AI智能问答系统和AI人脸识别系统。计算机11.2万字
- 会员Three.js在过去几年中已经成为创建令人惊叹的3DWebGL内容的标准方式。本书探讨Three.js的所有特性,并提供额外的内容,包括如何将Three.js与Blender、React、TypeScript以及最新的物理引擎进行集成。本书共分为四个部分:第一部分介绍搭建开发环境和运行Three.js;第二部分介绍Three.js的核心组件;第三部分介绍如何创建复杂的几何体、动画和纹理;第四部计算机13.3万字
- 会员本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超计算机13.2万字
- 会员本书书分为以下几部分:第一部分:预备知识:介绍数据结构和算法的基本概念,并演示如何搭建开发环境、编写测试用例。第二部分:数据结构:介绍常见的数据结构,包括数组、链表、矩阵、栈、队列、跳表、散列、树、图等。第三部分:常用算法:介绍常用的算法,包括分而治之、动态规划、贪婪算法、回溯、分支界定、遗传算法等。第四部分:商业实战:介绍汉诺塔及五子棋两款游戏的实现。计算机0字
- 会员本书介绍了Docker和Kubernetes的相关知识,可以帮助读者快速了解并熟练配置Kubernetes。本书共分为16章。首先介绍了Docker基础和Docker进阶;然后介绍了Kubernetes的基础操作,包括部署Kubernetes集群、升级Kubernetes、创建及管理Pod等;之后重点介绍了存储管理、密码管理、Deployment、DaemonSet及其他控制器、探针、Job、服务计算机8.6万字
- 会员本书是与主教材《C语言程序设计》配套的实验与训练参考书,同时也是一本可以独立于主教材的实验练习与实训提高的实践教材。全书分为四部分。第一部分是与主教材内容对应的基础知识与习题练习,第二部分是上机实践与实验指导,第三部分是综合实训与技能提高,第四部分是计算机等级考试介绍。计算机7.1万字