《用Python写网络爬虫》——第1章网络爬虫简介 1.1 网络爬虫何时有用-白红宇

本节书摘来自异步社区《用Python写网络爬虫》一书中的第1章，第1.1节，作者 [澳]Richard Lawson（理查德劳森），李斌译，更多章节内容可以访问云栖社区“异步社区”公众号查看。

第1章网络爬虫简介

本章中，我们将会介绍如下主题：

网络爬虫领域简介；

解释合法性质疑；

对目标网站进行背景调研；

逐步完善一个高级网络爬虫。

1.1 网络爬虫何时有用

假设我有一个鞋店，并且想要及时了解竞争对手的价格。我可以每天访问他们的网站，与我店铺中鞋子的价格进行对比。但是，如果我店铺中的鞋类品种繁多，或是希望能够更加频繁地查看价格变化的话，就需要花费大量的时间，甚至难以实现。再举一个例子，我看中了一双鞋，想等它促销时再购买。我可能需要每天访问这家鞋店的网站来查看这双鞋是否降价，也许需要等待几个月的时间，我才能如愿盼到这双鞋促销。上述这两个重复性的手工流程，都可以利用本书介绍的网络爬虫技术实现自动化处理。

理想状态下，网络爬虫并不是必须品，每个网站都应该提供API，以结构化的格式共享它们的数据。然而现实情况中，虽然一些网站已经提供了这种API，但是它们通常会限制可以抓取的数据，以及访问这些数据的频率。另外，对于网站的开发者而言，维护前端界面比维护后端API接口优先级更高。总之，我们不能仅仅依赖于API去访问我们所需的在线数据，而是应该学习一些网络爬虫技术的相关知识。

第1章 网络爬虫简介

1.1 网络爬虫何时有用

第1章网络爬虫简介