《利用python进行数据分析》学习之文件加载、写入
时间:2019-09-28
本文章向大家介绍《利用python进行数据分析》学习之文件加载、写入,主要包括《利用python进行数据分析》学习之文件加载、写入使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
csv文件读取¶
In [1]:
import pandas as pd
import sys
In [2]:
%cat examples/ex2.csv
In [3]:
#文件没有标签数据
pd.read_csv('examples/ex2.csv',header=None)
Out[3]:
In [4]:
pd.read_csv('examples/ex2.csv',names=['a','b','c','d','massage'])
Out[4]:
In [5]:
#将其中的一列设为索引列
pd.read_csv('examples/ex2.csv',names=['a','b','c','d','massage'],index_col='massage')
Out[5]:
In [6]:
list(open('examples/ex3.txt'))
Out[6]:
In [7]:
#多出的一列数据自动识别为索引,分隔符不同使用正则表达式
pd.read_csv('examples/ex3.csv',sep='\s+')
Out[7]:
将读取的非空数据设为NaN¶
In [8]:
%cat examples/ex5.csv
In [9]:
pd.read_csv('examples/ex5.csv',na_values={'something':'two','massage':['NA','foo']})
Out[9]:
In [10]:
#只读取一部分数据
pd.read_csv('examples/ex6.csv',nrows=10)
Out[10]:
In [11]:
#将数据分块读取
chunker = pd.read_csv('examples/ex6.csv',chunksize=1000)
for piece in chunker:
print(piece.iloc[0])
写入csv文件¶
In [12]:
data = pd.read_csv('examples/ex5.csv')
data.to_csv(sys.stdout)
In [13]:
data.to_csv(sys.stdout,sep='|')
In [14]:
#对缺失值进行标识
data.to_csv(sys.stdout,na_rep='NULL')
In [15]:
data.to_csv(sys.stdout,index=False,header=False)
In [16]:
#只写入子集
data.to_csv(sys.stdout,index=False,columns=['a','b','c'])
json文件¶
In [17]:
%cat examples/example.json
In [18]:
data = pd.read_json('examples/example.json')
data
Out[18]:
In [19]:
data.to_json(sys.stdout)
In [20]:
#按行写入
data.to_json(sys.stdout,orient='records')
HTML¶
In [21]:
#搜索并解析包含在table标签中的数据
tables = pd.read_html('examples/fdic_failed_bank_list.html')
#只有一张表格
len(tables)
Out[21]:
In [22]:
data = tables[0]
data.head()
Out[22]:
In [24]:
data.to_excel('examples/ex2.xlsx')
Web API¶
In [25]:
import requests
url = 'https://api.github.com/repos/pandas-dev/pandas/issues'
resp = requests.get(url)
resp
Out[25]:
In [26]:
data = resp.json()#data为字典数组
issues = pd.DataFrame(data,columns=['title','url','state','labels'])#提取部分字段
issues.head()
Out[26]:
原文地址:https://www.cnblogs.com/FinnChan/p/11604881.html
- mysql中case when用法
- 高质量代码的特征
- 完全掌握Android Data Binding
- eclipse+webservice开发实例
- tomcat 用AXIS2发布WebService 网站的方法
- JSP 中EL表达式用法详解
- CSS判断不同分辨率显示不同宽度布局CSS3技术支持IE6到IE8
- Hibernate详细教程
- TensorFlow中的多线程
- nginx 域名绑定 域名, nginx 域名绑定 端口
- Centos下Yum安装PHP5.5,5.6,7.0
- 请注意,我们要谈谈神经网络的注意机制和使用方法
- Configure Apache Virtual Hosts - CentOS 7
- centos7查看端口命令
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 【风险通告】FastAdmin会员中心Getshell漏洞
- Azure Cosmos DB介绍及演示
- 从一次编译出发梳理概念: Jetty,Jersey,hk2,glassFish,Javax,Jakarta
- 《一起学sentinel》一、一起搭建sentinel服务
- InfluxDB和Grafana实现传感器数据的存储和可视化
- 样本相关性分析
- Android 序列化 Serializable与Parcelable
- 《一起学sentinel》二、初探sentinel的Slot
- Redis突然报错,今晚又不能回家了...
- 查询ElasticSearch:用SQL代替DSL
- Java开源框架中的设计模式以及应用场景
- 统一定制API返回格式,我只做了这几件事
- 《一起学sentinel》三、Slot的子类及实现之NodeSelectorSlot和ClusterBuilderSlot
- 《一起学sentinel》四、Slot的子类及实现之LogSlot和StatisticSlot
- 《一起学sentinel》五、Slot的子类及实现之AuthoritySlot和SystemSlot