Day19之爬虫第一步,re模块来铺路

时间:2019-08-20
本文章向大家介绍Day19之爬虫第一步,re模块来铺路,主要包括Day19之爬虫第一步,re模块来铺路使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。


真的困炸了,我还能撑多久,为什么每天都睡不够呢,原因到底是什么,原因就是我真的没睡够啊他娘的。
我才睡六个小时多一点,今天晚上洗完澡十二点多必须睡觉,不睡的话就是傻逼。
眼皮架不住,我要学tom

打气打气,给我的脑子也打打气

今日洗脑金句: 好的朋友推你一把,坏的朋友扯你一下,鉴别损友,即日做起。

re模块

朋友,想要实现梦想吗,想要免费看片吗?想要在网上尽情冲浪吗!那你就得好好学习这个模块啦!

学好了这个模块,就等于解决了一部分的爬虫,离你的梦想又进了一步。

什么是re模块?

一、正则表达式

正则表达式本身是一种小型的、高度专业化的编程语言,它并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了。而在python中,通过内嵌集成re模块,程序员们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。

巴拉巴拉,巴拉巴拉。 就是在一串字符串里找特定的字符串。

这么多东西,不是所有的都要精通,我来讲一下需要好好学的内容。

既然是模块,就要import

昨天有个读者向我抱怨说我的图太少了,想要看我ide的截图,好吧,真是抱歉,接下来多放一些图。

好了,re模块非常重要,一定要把这里的内容掌握,不求背下去,但是至少在遇到的时候要知道能用这个解决,然后通过百度或者其他资源途经找到解决方法。

还有,感谢轻哥,我从来没想到原来可以截图ide的内容,我长这么大都没遇到过这么无理的要求。居然要我放截图。

​ @xxx

typing模块

typing模块: 提供了Generator,Iterable,Iterator三种数据类型,限制函数

他就是用来限制参数的数据类型的。

其实就是很鸡肋的东西,只要你代码写写规范,就根本用不到,就算你不规范出错了,也可以很快的就找到问题所在了,根本用不到这种模块,画蛇添足。垃圾

collections模块

collections模块: 复杂的数据类型

所以今天主要的重要内容还是re模块,多学习这个模块,用来提取爬取过来的信息中的关键字段十分有用,加油宝贝,洗洗睡。

原文地址:https://www.cnblogs.com/chanyuli/p/11385632.html