前言

闲来无事，看了一下后台文章的阅读数据，发现随便乱写的 验证码绕过居然是历史最高的阅读，惊了，我也不知道是对验证码绕过有兴趣，还是对刷课的方法有兴趣

所以反正闲着也是闲着，就写个爬虫刷课的思路，也欢迎指点，这部分，我要分两篇来写

一呢，主要是我懒，明天都周六了，就应该躺在床上玩手机浪费时间，不应该学习了

二呢，是将基础篇和思路篇分开来，这样会好点（而且我还能多水一篇）

正文

那么众所周知的是，网页分为，动态网页和静态网页这两个，这两者的区别就在于，他页面的数据是否有进行交互

比如你用自己的账号 Elapse登录了一个论坛

你在进入个人中心时，显示的肯定是你 Elapse的账号信息

但是这个时候，你右键查看源代码的时候，会发现你的数据并不在源代码中，在相对应的位置可能是一串你看不懂的代码

这是因为，这个网页的数据，是从后端的数据库（或者是其他类数据库的文件）中获取来的，那么如果他页面不是动态的，名字那个地方不是一串代码，会发生什么事呢

用户B用 Ernket这个ID登录了论坛，发现

个人中心里居然是别人的信息，嗨呀，气不气，气死了，这个用户B辛辛苦苦上了一天的网课，结果全计到用户A的头上去了，心态爆炸

所以，任何这种需要数据交互的地方，都是动态页面，因为你总不能，一个网站成千上百的用户，首页打开来全是”欢迎您 Elapse“而不是显示你的名字

但是有一个问题就随之而来了，我爬虫，请求页面的时候，不也是请求到这些乱七八糟的玩意吗，那我还怎么刷课啊，内容我都找不到了

那么前面提到了一个，网页的数据，是从别的地方请求来的，这种东西，叫 API，也叫接口

我们假设，用户登录成功后，会有一个参数

id=123456

这个参数，是这个用户的ID，当网页登录成功后，他会通过接口，将id这个参数发送过去，服务器在接收到了之后查找，找到了之后，就打包发送回去

这个时候网页A收到了数据a，将a打开来一看，用户名、课程名全在上面，于是就一一对应上去相应的位置

所以，你爬虫访问页面没有数据时，这个时候，只需要轻按下你电脑的 F12，然后点击 XHR这样就会显示当前页面，请求了哪些接口，你在根据返回的内容判断这个接口是做什么的就好了

你可以通过开发者工具，来看他请求了哪些页面，用的参数是什么，以及返回的内容是什么，根据这些，来编写程序，爬取你想要的内容

有没有好看的小说推荐啊？