Pandas

时间:2019-09-08
本文章向大家介绍Pandas,主要包括Pandas使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

DataFrame结构

DataFrame对象既有行索引,又有列索引

行索引,表明不同行,横向索引,叫index,0轴,axis=0
列索引,表名不同列,纵向索引,叫columns,1轴,axis=1


DatatFrame的属性

  • shape

  • df.shape—形状

  • df.index--行索引

  • df.columns--列索引

  • df.values—值—ndarray

  • df.T-转置—注意:转置后行索引-列索引互换

  • df.head(n)—看头部的n(默认5)行

  • df.tail(n)—看尾部的n(同上)行


DatatFrame索引的设置

  • 修改索引

    • df.index=新索引
    • 注意:只能整体修改--Index类型是一个不可变(immutable)对象
  • 重设索引

    • df.reset_index(drop=Fasle)
    • 注意:df中的索引本身也是数据的一部分
    • drop:默认为False,不删除原来索引,如果为True,删除原来的索引值
  • 列设为索引

    • df.set_index(keys)
    • keys:列索引名成或者列索引名称的列表---可以设置多列(类似于数据库表中的组合主键)
    • drop : boolean, default True.当做新的索引,删除原来的列

MultiIndex与Panel

MultiIndex
多级或分层索引对象。

  • index属性
    • names:levels的名称
    • levels:每个level的元组值
df.index.names
FrozenList(['year', 'month'])

df.index.levels
FrozenList([[1, 2], [1, 4, 7, 10]])

Panel

注:Pandas从版本0.20.0开始弃用:推荐的用于表示3D数据的方法是通过DataFrame上的MultiIndex方法

  • class pandas.Panel(data=None, items=None, major_axis=None, minor_axis=None, copy=False, dtype=None)
    • 存储3维数组的Panel结构

原文地址:https://www.cnblogs.com/oklizz/p/11488225.html