Day19之爬虫第一步,re模块来铺路
真的困炸了,我还能撑多久,为什么每天都睡不够呢,原因到底是什么,原因就是我真的没睡够啊他娘的。
我才睡六个小时多一点,今天晚上洗完澡十二点多必须睡觉,不睡的话就是傻逼。
眼皮架不住,我要学tom
打气打气,给我的脑子也打打气
今日洗脑金句: 好的朋友推你一把,坏的朋友扯你一下,鉴别损友,即日做起。
re模块
朋友,想要实现梦想吗,想要免费看片吗?想要在网上尽情冲浪吗!那你就得好好学习这个模块啦!
学好了这个模块,就等于解决了一部分的爬虫,离你的梦想又进了一步。
什么是re模块?
一、正则表达式
正则表达式本身是一种小型的、高度专业化的编程语言,它并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了。而在python中,通过内嵌集成re模块,程序员们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。
巴拉巴拉,巴拉巴拉。 就是在一串字符串里找特定的字符串。
这么多东西,不是所有的都要精通,我来讲一下需要好好学的内容。
既然是模块,就要import
昨天有个读者向我抱怨说我的图太少了,想要看我ide的截图,好吧,真是抱歉,接下来多放一些图。
好了,re模块非常重要,一定要把这里的内容掌握,不求背下去,但是至少在遇到的时候要知道能用这个解决,然后通过百度或者其他资源途经找到解决方法。
还有,感谢轻哥,我从来没想到原来可以截图ide的内容,我长这么大都没遇到过这么无理的要求。居然要我放截图。
@xxx
typing模块
typing模块: 提供了Generator,Iterable,Iterator三种数据类型,限制函数
他就是用来限制参数的数据类型的。
其实就是很鸡肋的东西,只要你代码写写规范,就根本用不到,就算你不规范出错了,也可以很快的就找到问题所在了,根本用不到这种模块,画蛇添足。垃圾
collections模块
collections模块: 复杂的数据类型
所以今天主要的重要内容还是re模块,多学习这个模块,用来提取爬取过来的信息中的关键字段十分有用,加油宝贝,洗洗睡。
原文地址:https://www.cnblogs.com/chanyuli/p/11385632.html
- 用机器学习方法对影评与观影者情感判定
- 关于查看文件的几个小命令(r3笔记第6天)
- 关于纠结的recycle pool的设置(r3笔记第5天)
- 融会贯通学习trigger(r2笔记第4天)
- 完整的R语言预测建模实例-从数据清理到建模预测
- 利用回归模型预测数值型数据(代码)
- 关于ORA-00020问题的反思(r2笔记第3天)
- 查看空间使用情况的脚本(r2笔记第2天)
- 使用dbms_parallel_execute来完成DML的并行(r3笔记第1天)
- 有趣的linux命令总结(78天)
- 生产环境sql语句调优实战第七篇(r2笔记99天)
- 一个普通数据库用户所能查到的"意料之外"的信息(r2笔记98天)
- 查看并行进程的一些简单信息(r3笔记第17天)
- 多行数据的批处理之bulk collect(r3笔记第16天)
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- PHP实现单条sql执行多个数据的insert语句方法
- PHP的JSON封装、转变及输出操作示例
- php 策略模式原理与应用深入理解
- 解决在Laravel 中处理OPTIONS请求的问题
- PHP使用观察者模式处理异常信息的方法详解
- php判断目录存在的简单方法
- 怎么优雅的使用 laravel 的 validator验证办法
- Thinkphp5.0框架的Db操作实例分析【连接、增删改查、链式操作等】
- php设计模式之适配器模式原理、用法及注意事项详解
- php基于Redis消息队列实现的消息推送的办法
- tp5框架无刷新分页实现方法分析
- PHP与SQL语句写一句话木马总结
- golang实现php里的serialize()和unserialize()序列和反序列办法详解
- php和html的区别点详细总结
- 详解在YII2框架中使用UEditor编辑器发布文章