一、题目:
1、"超市营业额2.xlsx"查看单日交易总额最小的3天的交易数据,并查看这3天是周几。
2、"超市营业额2.xlsx"把所有员工的工号前面增加一位数字,增加的数字和原工号最后一位相同,把修改后的数据写
入新文件“超市营业额2_修改工号.xlsx“。例如,工号1001变为1101,1003变为31003
二、代码展示:
书中的代码由于后期python以及pandas版本更新,部分地方出错,出错的地方我已经编注出来了,帮后来人减少寻找错误时间
# -*- coding: utf-8 -*-
'''@Author : Jackma@Time : 2020/11/22 19:42@File : 2020_11_22.py@Software: PyCharm@URL : www.jackrma.com@Copyright:博客所有权归本人和CSDN所有,如有转载请在显著位置给出博文链接和作者姓名,否则本人将付诸法律。@Version :
'''# 1."超市营业额2.xlsx"查看单日交易总额最小的3天的交易数据,并查看这3天是周几
# 2."超市营业额2.xlsx"把所有员工的工号前面增加一位数字,增加的数字和原工号最后
# 一位相同,把修改后的数据写入新文件“超市营业额2_修改工号.xlsx“。例如,工
# 号1001变为1101,1003变为31003from copy import deepcopy
import pandas as pd
import xlrd # 书中原程序没加,需加上此模块
import openpyxl # 书中原程序没加,需加上此模块'''
#读取文件中的数据,删除重复数据,把缺失的交易额使用每个员工自己所有交易额的中值进行填充,
# 把小于500的交易额统一改为500,大于3000的交易额改为3000,修改后的数据保存为文件“数据调整结果.xlsx”,
# 文件结构与“超市营业额2.xlsx”相同。然后使用修改后的数据完成后面的题目。
df = pd.read_excel("超市营业额2.xlsx")
# df.drop_duplicates(implace=True) # 去重
df.drop_duplicates() # 去重
for i in df[df.交易额.isnull()].index:df.loc[i, '交易额'] = round(df.loc[df.姓名 == df.loc[i, '姓名'], '交易额'].median())
df.loc[df.交易额 < 500, '交易额'] = 500
df.loc[df.交易额 > 3000, '交易额'] = 3000
df.to_excel('数据调整结果.xlsx', index=False)
'''# 1
# "超市营业额2.xlsx"查看单日交易总额最小的3天的交易数据,并查看这3天是周几
df = pd.read_excel("超市营业额2.xlsx")
df2 = df.groupby(by="日期", as_index=False).agg({"交易额": "sum"}).nsmallest(3, '交易额')# # 根据日期分类汇总,按交易额求和汇总# # nsmallest: 传入保留最小的前几位n和保留的列名
# print(pd.to_datetime(df2.日期).dt.weekday_name)# # 原来这里的weekday_name错误,注pandas版本更新问题
print(pd.to_datetime(df2.日期).dt.day_name())# 2
df3 = deepcopy(df)
df3['工号'] = df['工号'].map(lambda s: str(s)[-1] + str(s))
df3.to_excel('超市营业额2_修改工号.xlsx',index = False)
三、结果展示:
程序1、查看单日交易总额最小的3天的交易数据,并查看这3天是周几。
程序2、把所有员工的工号前面增加一位数字,增加的数字和原工号最后一位相同。把修改后的数据写入新文件“超市营业额2_修改工号.xlsx“。
整个工程文件和“超市营业额2.xlsx“文件打包放在CSDN分享中