数据分析 常见技巧和经验总结

时间:2022-07-25
本文章向大家介绍数据分析 常见技巧和经验总结,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

1.Pandas将dateime类型格式化为字符串

Pandas中有很多数据类型,其中有一种是datetime,即日期时间,如Timestamp(‘2020-09-22 20:43:00’),表示其是一个时间戳类型,很多时候需要将其转化为字符串,以便获取到其中的日期或时间,此时可以对其调用strftime()方法,如strftime('%Y-%m-%d')就可以获取到字符串2020-09-22。 在pandas中的DataFrame中,一般是整列替换,此时需要用到lambda表达式和apply方法,如下:

order_detail['date'] = order_detail['date'].apply(lambda x:x.strftime('%Y-%m-%d'))

即可完成将datetime类型转化为指定格式的字符串。

2.Pandas读取.sql文件

pandas读取数据的方式和支持的格式有很多,包括读取数据库数据,但是一般不能直接读取.sql文件,而是一般先执行.sql文件中的SQL语句将数据导入到MySQL数据库中,再使用pandas从数据库中读取数据。 执行.sql文件中的SQL语句一般可以使用数据库可视化工具,如Navicat和SQLYog等,这里以Navicat为例导入.sql文件数据如下:

然后再使用Python从数据库中读取数据,如下:

import pandas as pd
import pymysql

sql = 'select * from table_name' # 换成自己的表名

con = pymysql.connect(host='127.0.0.1', port=3306,user='root',password='root',database='python_da',charset='gbk') # 换成自己的数据库
order_detail = pd.read_sql(sql,con)

如果没有mymysql库,可以执行pip install pymysql或者conda install pymysql进行安装。