Pandas常用操作
时间:2019-09-29
本文章向大家介绍Pandas常用操作,主要包括Pandas常用操作使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
Pandas是一个基于NumPy的库,为python提供了易用的数据结构和数据分析工具。
导入
import pandas as pd
Pandas数据结构
Series
一维的有标签的数组,可以容纳任何类型的数据。
s = pd.Series([3,-5,7,4],index=['a','b','c','d'])
DataFrame
二维的有标签的数据结构,每一列都可能有不同的类型
data = {'Country':['Belgium','India','Brazil'],
'Capital':['Brussels','New Delhi','Brasilia'],
'Population':[11190846,1303171035,207847528]}
df = pd.DataFrame(data,columns=['Country','Capital','Population'])
筛选数据
s['b'] #获取Series一个元素
df[1:] #获取DataFrame的一个子集
# 通过行列号获取单个数据
df.iloc[[0],[0]]
df.iat([0],[0])
# 通过行号和标签获取单个数据
df.loc[[0],['Country']]
df.at([0],['Country'])
# 通过行号和标签获取若干数据
df.ix[2] #获取第二行的数据和标签
df.ix[:,'Capital'] #获取某一列
df.ix[1,'Capital'] #获取某个元素
# 通过布尔变量索引
s[~(s>1)] #获取Series中不大于1的数据
s[(s<-1)|(s>2)] #获取Series中小于-1或大于2的数据
df[df['Population']>12000] #获取人数大于12000的数据
丢弃数据
s.drop(['a','c']) #根据label丢弃Series中的数据
df.drop('Country',axis=1) #丢弃一列的数据 (axis=0,row-wise)(axis=1,col-wise)
#(axis=2,depth-wise)
排序
df.sort_index() #根据索引排序
df.sort_values(by='Country') #根据某列排序
df.rank() #将所有数据转化为序数数据
获取数据的信息
基础信息
df.shape #(行,列)
df.index #显示index的范围和步长
df.columns #显示每列的信息
df.info() #显示DataFrame的整体信息
df.count() #统计每列非零元素的个数
总结信息
df.sum() #求和
df.cumsum() #累加
df.min()/df.max() #极值
# 以上操作都是在所有列上分别进行
df.idxmin()/df.idxmax() #看不懂
以下操作只在数值列进行
df.describe() #显示统计量
df.mean() #显示均值
df.median() #显示中位数
使用函数
f = lambda x:x*2
df.apply(f) #作用在dataframe的一行或一列上
df.applymap(f) #作用在dataframe的每个元素上
数据对齐
缺失列默认用NaN补齐
可以用fill_value参数指定补齐数据
原文地址:https://www.cnblogs.com/JasonBUPT/p/11610032.html
- mysql启动后随即关闭问题解决(ibdata1文件损坏导致)
- webvirtmgr-重命名kvm虚拟机的名称
- Lucene 2.0最基本的入门代码
- 网站每日PV/IP统计/总带宽/URL统计脚本分享(依据网站访问日志)
- 查看服务器系统资源(cpu,内容)利用率前几位的进程的方法
- 腾讯云平台部总经理陈磊:大数据背后的技术支撑
- DataSet与Xml相互转化
- SqlTransaction事务使用示例
- nginx的web缓存服务环境部署记录
- nginx反向代理+缓存开启+url重写+负载均衡(带健康探测)的部署记录
- [转自blueidea]像table一样布局div Ⅰ
- 如何对动态创建控件进行验证以及在Ajax环境中的使用
- 升级个人网站框架组件IBatisNet+Castle
- 如何在多线程中调用winform窗体控件
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- android自定义手表效果
- Android 测量文字宽度的实例方法
- Android 添加系统服务的方法详解
- android实现录屏小功能
- Android控件CardView实现卡片效果
- 非常好看的android音量旋钮
- Android实现按钮拖拽还原功能
- 百度地图实现小车规划路线后平滑移动功能
- frp内网穿透部署搭建教程,内网端口暴露给了外网
- Android使用Intent的Action和Data属性实现点击按钮跳转到拨打电话和发送短信界面
- Linux安装Collabora Online让NextCloud支持Office在线编辑
- 教你在CentOS7安装Vuze(Azureus)
- Pwn-EXP模板
- Linux学习随手记
- PHP session用法其实很简单