自己动手写网络爬虫(修订版)在线阅读
会员

自己动手写网络爬虫(修订版)

罗刚编著
开会员,本书免费读 >

计算机网络编程语言与程序设计11.2万字

更新时间:2021-04-02 22:21:53 最新章节:本章小结

立即阅读
加书架
下载
听书

书籍简介

本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
品牌:清华大学
上架时间:2016-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

罗刚编著
主页

同类热门书

最新上架

  • 会员
    《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理
    马国俊计算机9.2万字
  • 会员
    本书是一本致力于Web开发技术的实战指南。本书紧跟行业的最新发展趋势,全面而深入地阐述了SpringBoot3和Vue3在企业级应用开发中的集成与应用。全书共分为8章,从SpringBoot3的基础入门到Vue3的高级应用,再到前后端通信、测试与部署,每一章的内容都经过精心设计,以确保读者能够掌握关键的技能。第8章特别提供了一个综合案例,展示如何综合运用全书知识来构建一套完整的应用系统
    刘伟编著计算机14万字
  • 会员
    随着人机交互和AI技术的快速发展,设计师需要从基于屏幕的图形用户界面设计思维,转变为空间交互及智能交互的设计思维。本书从设计师要懂技术的原因讲起,引导设计师结合技术去思考设计,并针对跨设备交互设计、基于AI的设计及各种传感技术(姿态和手势识别、人脸识别和追踪、眼动追踪等)进行解读与案例分析,帮助设计师更好地应对未来的工作挑战。
    薛志荣计算机15.8万字
  • 会员
    《Django+Vue.js商城项目实战》基于Django4.x和Vue3.x版本,以一个完整商城网站的开发流程为主线,介绍分别使用纯后端架构和前后端分离架构实现项目的全部技术细节。纯后端开发架构主要讲解Django的知识要点及每个功能模块的要点和实现方式,内容包括Django网站开发基础、项目需求与设计、路由规划与设计、商城数据模型的搭建与使用、数据业务视图、数据渲染与展示、商品信息模块、用户
    黄永祥编著计算机15.4万字
  • 会员
    本书围绕真实业务场景,系统完整地介绍了微服务中台架构在企业成功落地的全过程。它从企业遇到的IT架构痛点出发,覆盖了IT架构模式选型、技术方案设计、团队管理和项目实施过程中的每一步,并且介绍了如何基于阿里云PaaS平台,构建低风险、高可用、易扩展、好维护的业务中台。本书可以帮助对企业IT架构感兴趣的中高级软件工程师、架构师、产品经理、项目经理,深刻认识和理解业务中台,从而结合企业实际,快速搭建适合自
    任波计算机11.9万字
  • 会员
    本书是国内首先使用Pythontkinter设计GUI的中文书籍之一。本书主要讲解如何在窗口内使用Python的内部模块tkinter设计图形用户接口(GUI)程序,让用户可以利用图形接口与计算机沟通。tkinter模块是一个跨平台的窗口应用程序,使用它设计的程序可以在Windows、macOS、Linux系统上执行。2019年《PythonGUI设计tkinter菜鸟编程》一经出版便受到广大读者
    洪锦魁编著计算机6.4万字
  • 会员
    本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,也包括具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。本书共14章,分为工具集基础用例演示篇(第1~6章),详细讲解
    李福林计算机7.7万字
  • 会员
    本书详细阐述如何在设计、规划和实现软件时做出更好的决策,通过真实的案例,以抽丝剥茧的方式分析那些失误的决策,探讨还有哪些可能的解决方案,并对比各种方案的优缺点,摸索软件设计的常青模式。本书通过实例来说明某些决策的后果,例如代码重复如何影响系统的耦合与演进速度,以及如何在日期和时间信息方面隐藏细微差别。本书还介绍如何根据帕累托法则有效地缩小优化范围,确保分布式系统的一致性。通过阅读本书,读者很快就可
    (美)托马斯·莱莱克 (英)乔恩·斯基特计算机23.9万字
  • 会员
    本书在不涉及大量数学与编程知识的前提下,从零开始,逐步带领读者熟悉并掌握当下最新的基于Python3的人工智能编程工具,包括但不限于数据分析(Pandas),以及支持单机(Scikitlearn)、深度(PyTorch、TensorFlow、PaddlePaddle)和分布式(PySparkML)机器学习的开源程序库,等等。全书共分为4部分,分别如下。入门篇:包括对全书核心概念的指南性介绍,
    范淼 徐晟桐计算机9.4万字