会员
网络数据采集技术:Java网络爬虫实战
钱洋等更新时间:2020-09-29 15:50:25
最新章节:9.4 本章小结开会员,本书免费读 >
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
网络数据采集技术:Java网络爬虫实战最新章节
查看全部- 9.4 本章小结
- 9.3 WebMagic的使用
- 9.2 WebCollector的使用
- 9.1 Crawler4j的使用
- 第9章 网络爬虫开源框架
- 8.9 本章小结
- 8.8 截取验证码
- 8.7 隐藏浏览器
- 8.6 动态加载JavaScript数据(操作滚动条)
- 8.5 模拟登录
钱洋等
主页
同类热门书
最新上架
- 会员
Django 5企业级Web应用开发实战(视频教学版)
《Django5企业级Web应用开发实战:视频教学版》精选当前简单、实用和流行的Django实例代码,帮助读者学习和掌握Django5框架及其相关技术栈的开发知识。本书系统全面、内容翔实、重点突出、通俗易懂,基本涵盖Django5框架应用开发的所有技术。《Django5企业级Web应用开发实战:视频教学版》共分为13章,内容包括Django框架基础与环境搭建、常用配置、模型、视图与路由、模计算机15.9万字 - 会员
商业银行经营管理(第2版)
本书系统地讲解了现代商业银行的基本原理和知识框架,特别注重通过中外银行网站、年报、典型案例、相关法律法规、重大事件等,来介绍当前国内外银行业务的基本状况、重要改革和未来发展方向,教材图文并茂,内容翔实生动。本书可作为金融学专业本科生或金融专业硕士研究生的课程教学用书,也可作为从业人员了解银行业基础知识的参考书。计算机41万字 - 会员
Vue.js 3.0源码解析(微课视频版)
本书共分为11章,将从源码角度入手,由浅入深分析Vue3框架的核心逻辑。首先通过极简demo引出Vue3框架核心思想,其次结合源码分析Vue3框架核心逻辑的实现原理,最后介绍Vue3框架常用命令、组件等底层实现逻辑。帮助读者深入理解Vue3框架的内部实现原理与运行逻辑,理解Vue3框架语法,揭开藏在表面的内容,让开发者能知其然还能知其所以然。本书面向有Vue开发经验和熟悉框架开发的前端计算机6.5万字 - 会员
H5页面设计与制作(全彩慕课版·第2版)
本书全面、系统地介绍H5页面的相关知识点和基本制作方法。全书共10章,包括初识H5、H5页面的设计与制作、互动游戏H5页面的制作、活动抽奖H5页面的制作、测试问答H5页面的制作、滑动翻页H5页面的制作、长页滑动H5页面的制作、画中画H5页面的制作、3D/全景H5页面的制作及视频动画H5页面的制作等内容。第3~10章还设置课堂练习与课后习题,用以提高学生的实际应用能力。计算机5.8万字 - 会员
Python数据分析快速上手
《Python数据分析快速上手》通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析应该掌握的各方面技术。本书内容包括Python基础,用NumPy进行数据计算,用Pandas进行数据分析,用SciPy进行数据分析,用Scikit-learn进行数据分析、数据预处理、数据可视化,用Matplotlib进行可视化等内容。本书示例丰富,所有涉及的程序代码都给出了详细的注释,读者可计算机11.5万字 - 会员
Python自动化测试教程
本书基于Python语言介绍自动化测试的基本概念和技术,旨在帮助读者了解和掌握自动化测试的实现方法。本书覆盖Python基本语法、自动化测试框架、测试用例的设计方法、集成测试的自动化等重要知识,并通过实际案例演示如何使用Python编写自动化测试脚本。本书适合测试人员和开发人员阅读。计算机6.5万字 - 会员
写给设计师的技术书:从智能终端到感知交互
随着人机交互和AI技术的快速发展,设计师需要从基于屏幕的图形用户界面设计思维,转变为空间交互及智能交互的设计思维。本书从设计师要懂技术的原因讲起,引导设计师结合技术去思考设计,并针对跨设备交互设计、基于AI的设计及各种传感技术(姿态和手势识别、人脸识别和追踪、眼动追踪等)进行解读与案例分析,帮助设计师更好地应对未来的工作挑战。计算机15.8万字 - 会员
SQL语言从入门到精通
《SQL语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了在开发中使用SQL语言必须掌握的技术。全书分为3篇共18章,内容包括SQL语言基础、SQL查询基础、复杂查询、数据排序、SQL函数的使用、分组统计、子查询、多表查询、添加数据、修改和删除数据、视图、存储过程、触发器、游标、索引、事务、管理数据库与数据表、数据库安全。所有知识都结合具体实例进行介绍,涉及的程序代计算机12.4万字 - 会员
HuggingFace自然语言处理详解:基于BERT中文模型的任务实战
本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,也包括具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。本书共14章,分为工具集基础用例演示篇(第1~6章),详细讲解计算机7.7万字