Pandas|排序,分组,组内排序

时间:2022-05-06
本文章向大家介绍Pandas|排序,分组,组内排序,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

01

Pandas的基本排序

Pandas的主要数据结构有2个:DataFrame,Series,针对这两个类型的排序Demo如下:

#coding=utf-8

import pandas as pd

import numpy as np

#以下实现排序功能。

series=pd.Series([3,4,1,6],index=['b','a','d','c'])

frame=pd.DataFrame([[2,4,1,5],[3,1,4,5],[5,1,4,2]],columns=['b','a','d','c'],index=['one','two','three'])

print(frame)

print(series)

#series的排序API

print('series通过索引进行排序:')

print(series.sort_index())

print('series通过值进行排序:')

print(series.sort_values())

#dataframe的排序API

print('dataframe根据行索引进行降序排序(排序时默认升序,调节ascending参数):')

print(frame.sort_index(ascending=False))

print('dataframe根据列索引进行排序:')

print(frame.sort_index(axis=1))

print('dataframe根据值进行排序:')

print(frame.sort_values(by='a'))

print('通过多个索引进行排序:')

print(frame.sort_values(by=['a','c']))

02

输出

b  a  d  c
one    2  4  1  5
two    3  1  4  5
three  5  1  4  2
b    3
a    4
d    1
c    6
dtype: int64
series通过索引进行排序:
a    4
b    3
c    6
d    1
dtype: int64
series通过值进行排序:
d    1
b    3
a    4
c    6
dtype: int64
dataframe根据行索引进行降序排序(排序时默认升序,调节ascending参数):
       b  a  d  c
two    3  1  4  5
three  5  1  4  2
one    2  4  1  5
dataframe根据列索引进行排序:
       a  b  c  d
one    4  2  5  1
two    1  3  5  4
three  1  5  2  4
dataframe根据值进行排序:
       b  a  d  c
two    3  1  4  5
three  5  1  4  2
one    2  4  1  5
通过多个索引进行排序:
       b  a  d  c
three  5  1  4  2
two    3  1  4  5
one    2  4  1  5

Pandas是具有行索引和列索引的表格,可以对这两个维度的索引分别排序。

03

Pandas分组

# data是DataFrame的实例

group_column1 = data.groupby('column1')

注意group_column1是一个Groupby类型的实例,它是可迭代的,元素为元包,第一个元素是组名称,第二个元素是子DataFrame。

04

Pandas组内排序

因为第二个元素是子DataFrame,所以:

for group_name, group_eles in group_column1:

group_eles.sort_values(by='column2',ascending=False)

这样就实现了组内排序

以上总结了Pandas的基本排序,分组,组内排序,希望有用,更好的API请留言