【实战】Python 读写 Excel 实例应用

时间:2022-04-26
本文章向大家介绍【实战】Python 读写 Excel 实例应用,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

学习了简单的 Python 操作 Excel 的两个库 xlrd 和 xlwt,今天来实际操作一个案例来增强实战功能。

案例背景

我们市场部的同学想通过分析广告投放时间前后(分钟级,前1分钟到后5分钟)的用户活跃数据来分析我们广告的投放效果,来决定是否继续投放和投放的其他选择性,所以他们需要我来帮忙计算一下数据。所以这里分享下实际操作。

数据准备

1、 广告播放时间

这里的广告播放时间文件为 ad.xlsx,由市场部同学提供,部分数据如下。

2、 用户活跃数据

一般从数据库计算导出(SQL 操作可以看我之前发布的 MySQL 相关知识),有时候也需要通过日志计算,已经计算好的数据 uv.xlsx 如下(分钟级)。这里我们区分了移动端和 PC 端。

数据计算

数据准备完毕之后,就可以直接计算了,因为前面已经说过xlrd和xlwt库的使用,这里直接贴上代码py_excel.py,大家可以实际操作试一试。(为了更好的查看代码,可以访问原文,这里的编辑器只能块引用)


#coding:utf-8
import xlrd
import xlwt
import re
import sys
import string
from datetime import datetime
 
#read the ad play time data
programFile = r'ad.xlsx'
#读取广告播放时间数据文件
adFile = r'ad.xlsx'
 
#打开文件并获取数据
adWb = xlrd.open_workbook(adFile)
adSheet = adWb.sheet_by_index(0)
 
#获取目标时间列(在第3列,由日期和时间拼接而成)
adTime = adSheet.col_values(2)
 
lenth_of_time = len(adTime)
 
#读取uv数据
uvFile = r'uv.xlsx'
 
uvWb = xlrd.open_workbook(uvFile)
#数据存储在一张表时,如果有多个sheet,要分开赋值
uvSheet = uvWb.sheet_by_index(0)
 
uvTime = uvSheet.col_values(0)
length = len(uvTime)
 
#初始化写操作
resultFile = xlwt.Workbook()
#在生成表的时候添加了两张sheet
resultMobile = resultFile.add_sheet('mobile',cell_overwrite_ok=True)
resultPC = resultFile.add_sheet('PC',cell_overwrite_ok=True)
 
i=1
while(i<lenth_of_time):
   print (i)
   playTime = xlrd.xldate_as_tuple(adTime[i],adWb.datemode)
   print (playTime)
    j= 1
    while(j<length):
       uvRow = uvSheet.row_values(j)
       uvTime = xlrd.xldate_as_tuple(uvRow[0],uvWb.datemode)
       #时间匹配
       if((playTime[0]==uvTime[0] and playTime[1]==uvTime[1] andplayTime[2]==uvTime[2] and ((playTime[3]==uvTime[3] and uvTime[4]-playTime[4]>-2and uvTime[4]-playTime[4]<6) or (uvTime[3]==playTime[3]+1 anduvTime[4]+60-playTime[4]>-2 and uvTime[4]+60-playTime[4]<6) or(uvTime[3]==playTime[3]-1 and uvTime[4]-59==0 and playTime[4]-0==0))) or(playTime[0]==uvTime[0] and playTime[1]==uvTime[1] and playTime[2]==uvTime[2]-1and uvTime[3]==0 and playTime[3]==23 and uvTime[4]+60-playTime[4]<6)):
           gap = uvTime[4]-playTime[4]
 
           if(gap<-50):
                gap=gap+60
           if(gap==59):
                gap=-1
 
           if(uvRow[1]=='mo'):
               resultMobile.write(i,gap+1,uvRow[2])
           if(uvRow[1]=='pc'):
               resultPC.write(i,gap+1,uvRow[2])
       j = j + 1
    i= i + 1
 
#保存结果
resultFile.save(r'result.xls')

查看结果:

首行数据表示分钟。

小结

上面就是今天的主题内容了,今天分享下如何使用 Python 操作 Excel 进行读写文件生成目标数据,方便后面进行数据分析。希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。