Pandas——高效的数据处理Python库
Pandas教程
pandas是高效的数据读取、处理与分析的Python库,下面将学习pandas的基本用法
1. 创造对象
导入pandas , numpy, matplotlib库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
Series是一个值的序列 ,它只有一个列,以及索引,下面的例子中,就是用默认的整数索引
DataFrame是有多个数据表,每个列拥有一个label,DataFrame也拥有索引
如果参数是一个dict(字典),每个dict的value会被转换成一个Series
可以这样理解,DataFrame是由Series组成
2.查看数据
用head和tail查看顶端和底端的几行 head和tail的默认参数是5
实际上DataFrame内部用numpy 格式存储数据,可以单独查看index和columns
describe()显示数据概要
和numpy一样,可以方便的得到转置
对axis按照index排序(axis=1指第二个纬度,即 列)
按值排序
3.选择行和列
从DataFrame选择一个列,就得到了一个Series
和numpy类似,这里可以使用 []
4.通过label选择
刚刚的DataFrame可以通过时间戳的下标(dates[0]=Timestamp(‘20170917’))来访问
还可以多选
冒号和Matlab或Numpy里面的冒号用法是一样的 也可以加上行
5.通过整数下标选择
和Matlab完全一样
选出3~4行, 0~1列
左闭右开
也可以用list选择
也可以用slice切片
对单个元素
布尔值下标
基本用法
没有填充的值均为NaN
copy()函数:复制DataFrame isin()函数:是否在集合中,并选出
Setting
为DataFrame增加新的列,按index对应
通过label 下标 numpy 布尔值作下标 设置
缺失值
pandas用np.nana表示缺失值,不加入计算
dropna()丢弃有NaN的行 fillna(value=5)填充缺失值 pd.isnull()获取布尔值的mask,哪些是NaN
统计
平均值 mean() 对另一个纬度做平均值只需加一个参数 mean(1) 这里的1是纬度, 0表示x , 1 表示y, 2表示z 以此类推
Apply函数
对行或列进行操作,可以用lambda表达式
读取csv xls hdf5
pd.read_csv('filename')
pd.read_excel('filename','Sheet1')
pd.read_hdf('filename')
- 并发编程之CyclicBarrier
- Golang方法和接口
- Js基础---红宝书读书日记(1)-------基本类型和引用类型
- 并发编程之future模式
- Html5模拟通讯录人员排序(sen.js)
- Goroutine + Channel 实践
- Http和Https的区别
- JavaScript实现单击全选 ,再次点击取消全选
- 连AI都在看《英雄联盟》游戏直播
- MAC使用adb工具
- 并发编程之master-worker模式
- Android WebView全面总结
- Url参数中出现+、空格、=、%、&、#等字符的解决办法
- 解决CSS垂直居中的几种方法(基于绝对定位,基于视口单位,Flexbox方法)
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Linux系统下部署项目的设置方法
- Linux中设置路由以及虚拟机联网图文详解
- 在Linux中如何一次重命名多个文件详解
- Vim自定义高亮分组以及一些实用技巧小结
- Linux redis-Sentinel配置详解
- 使用 Apache Web 服务器配置两个或多个站点的方法
- Linux下命令行cURL的10种常见用法示例
- Apache Web 服务器的安装配置方法
- Linux(Ubuntu 18.04)上安装Anaconda步骤详解
- seaborn关联图表之折线图和散点图
- Linux 系统下安装JDK1.8的教程详解
- Linux yum 命令安装mysql8.0的教程详解
- linux中叹号命令(!)的使用小结
- ubuntu下rz/sz命令的安装与使用说明
- Linux环境变量配置的完整攻略