pandas的聚合功能在excel中的应用总结

在处理excel数据时需要将一组具有相同标签值的数据给按标签抽取出来，同样的标签值对应着同一个类别，这项操作让我对pandas的聚合功能有了更深刻的认识。

所谓聚合groupby，实际上是指将向量或者向量对应的高维度数据映射为标量值的过程，这里强调求出标量值其实是为了好显示groupby对象，本身只做聚合的话其实得到的对象并不是dataFrame

而是一个<pandas.core.groupby>对象，这个对象是不能像dataFrame对象一样直接可视化的，为了要可视化，必须找到一个可以计算得到的标量值，

这里考虑到这次用到的excel本身的特点(顺便吐槽一下，这个让我帮忙做数据分析的项目其实就是个f**k_ing project，完全无脑的去找特征，实在是把室友逼得不要不要的了，看不下去才帮忙做的)

我有了一个非常大胆的想法，如果数据本身对应的示值只有一列，那么用mean计算出的值与本身是一样的，这样我采用了提取三列，其中两列用于聚合然后利用求mean搞到了可以写进excel里的dataFrame形式的groupby处理后的对象。

其实强调groupby处理完变回dataFrame对象主要是了文件读写，这是pandas中一个非常惨无人道的东西，所以为了读写统一，你懂的。

顺便提一句关于抽取dataFrame中不相连几列的方法，在df([['A', 'B', 'C']])的表达式中，注意有两个中括号，这个才是对列进行提取的关键语法，只有一对括号则是对行进行操作，千万注意。

说到了excel，最近师兄给的excel还要重新修改格式，做运算式解析时一对圆括号简直不忍直视，区分运算括号与参数括号真的也是一件十分头大的事情，话说回来，对大量数据进行操作的时候python的速度并不算快，可以泡杯茶好好享受一下生活了。。。

纪念2018-11-20第一次生嚼胡罗卜！