一日一技:Python的bytes型数据的迭代特征

时间:2022-06-25
本文章向大家介绍一日一技:Python的bytes型数据的迭代特征,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

Bytes类型是Python 3引入的一个基本数据类型。调用Bytes类型的 .decode()方法可以把它变成Python 3的 str类型。调用 str类型.encode()方法,可以把它变成Bytes类型。

如果字符串只由Ascii中的符号组成,那么它转换为Bytes类型以后打印出来,“看上去”仅仅是前面多了一个 b而已,如下图所示:

但是如果字符串里面包含Ascii符号之外的其他符号,那么转换为Bytes类型以后,就变得不一样了,如下图所示:

其中在Ascii符号以外的字符,会被编码为很多的十六进制值。

并且,即使是仅有Ascii字符,Bytes型数据的迭代特性也与字符串不一样。

  1. 当我们使用for循环展开字符串时,得到的是每一个字符,如下图所示:
  • 当我们使用for循环展开Bytes对象时,得到的是很多的Ascii编码,如下图所示:

这些编码实际上可以直接使用 chr转换为对应的字符,如下图所示:

  • 使用下标取某一个字符时,字符串能直接获取对应的符号,但Bytes类型只能获取到Ascii编码,例如:
  • 使用切片时,字符串和Bytes类型又都能得到对应的字符,如下图所示:
  • 对于中文或者其他非Ascii字符的符号,无论是用索引还是切片,都看不到原来的字符:

在Python 3里面,不少操作获取的都是Bytes型的数据,例如base64.b64decode()的输出结果、例如redis-py这个库从Redis中读取的数据……

所以在实际使用中,一定要分清楚当前数据是不是Bytes型,以免因为它的迭代行为与字符串不一致导致问题。

最后,不要因为Bytes型数据在迭代的时候不方便就讨厌它。这个数据类型有非常重要的作用。