python中处理时间有个datetime模块,模块定义了如下几个类:
为了大家熟悉上面常用的类,下面介绍一些实例。
#datetime.date类 import datetime print('1.现在是',datetime.date.today(),'日') print('2.现在是',datetime.date.today().year,'年') print('3.现在是',datetime.date.today().month,'月') print('4.现在是',datetime.date.today().day,'日') #得到结果: 1.现在是 2021-10-31 日 2.现在是 2021 年 3.现在是 10 月 4.现在是 31 日
#datetime.datetime类 import datetime print('1.现在是',datetime.datetime.today(),'日') print('2.现在是',datetime.datetime.today().year,'年') print('3.现在是',datetime.datetime.today().month,'月') print('4.现在是',datetime.datetime.today().day,'日') print('5.现在是',datetime.datetime.today().hour,'时') print('6.现在是',datetime.datetime.today().minute,'分') print('7.现在是',datetime.datetime.today().second,'秒') print('8.现在是',datetime.datetime.today().microsecond,'微秒') #得到结果: 1.现在是 2021-10-31 15:55:23.676360 日 2.现在是 2021 年 3.现在是 10 月 4.现在是 31 日 5.现在是 15 时 6.现在是 55 分 7.现在是 23 秒 8.现在是 677333 微秒
#datetime.timedelta类 import datetime today = datetime.date.today() yestoday = today + datetime.timedelta(days = -1) tomorrow = today + datetime.timedelta(days = 1) print('1.今天是', today,'日') print('2.昨天是', yestoday,'日') print('3.明天是', tomorrow,'日') #得到结果: 1.今天是 2021-10-31 日 2.昨天是 2021-10-30 日 3.明天是 2021-11-01 日
这一小节介绍把日期转换成字符,主要用到datetime.datetime.strftime
函数。
#dateTime to str date_time_now = datetime.datetime.now() str_now1 = datetime.datetime.strftime(date_time_now, '%Y-%m-%d') print(date_time_now) str_now1 #得到结果: 2021-10-31 16:20:45.391792 '2021-10-31'
这一小节介绍把字符转换成日期,主要用到datetime.datetime.strptime
函数。
#str to date str_time = '2021-10-21' date_time = datetime.datetime.strptime(str_time, '%Y-%m-%d').date() print(date_time) #得到结果: 2021-10-21
这一小节介绍把数值转换成日期。从excel数据表中读取时间,如果是2021/10/11这种格式,会转变成相应数值44480。这时需要转换成对应的日期,具体代码如下:
#num to date from datetime import datetime from xlrd import xldate_as_datetime, xldate_as_tuple num = 44480 datetime(*xldate_as_tuple(num,0)).strftime('%Y-%m-%d') #得到结果: '2021-10-11'
本小节是应用前面小节阐述的函数,处理实际工作中遇到的问题。比如有一批信贷催收数据,由于一个客户可能电话没有接通,导致存在多次拨打的可能。我们想分析客户没有还钱的真实原因,所以想取客户最后一次通话,催收员记录的客户逾期原因。这时就需要把数据集按合同号和拨打电话的时间排序,取最后一次拨打电话的逾期原因。
首先是读取数据,代码如下:
import pandas as pd from xlrd import open_workbook file_name = r'F:\公众号\43.时间函数\催记-2021-10-11至2021-10-17.xlsx' #文件名称 table = open_workbook(file_name) #打开文件 sheets_name = table.sheet_names() #获取excel中的sheet名 get_sheet1 = table.sheet_by_name('Sheet1') #获取Sheet1 data = list() for i in range(get_each_sheet.nrows): col_values = get_sheet1.row_values(i, start_colx=0, end_colx=None) data.append(col_values) data1 = pd.DataFrame(data) #把Sheet1中的数据读取出来生成数据框 data1.columns = data1.iloc[0] data1 = data1.drop(index=0) #数据框列名确定,并删除第一行 data2 = data1[['合同号', '姓名', '联络类型', '联络类型', '催收时间', '催收内容', '催收状态', '委案日期']] #取数据框中的固定列
注:如需本文数据,可直接在公众号中回复”催收数据时间处理”,即可免费获取。
得到结果:
接着是处理催收时间变成日期格式,代码如下:
from datetime import datetime from xlrd import xldate_as_datetime, xldate_as_tuple def num_to_date(num_): return datetime(*xldate_as_tuple(num_,0)).strftime('%Y-%m-%d') data2['催收时间'] = data2['催收时间'].apply(num_to_date) data2.head(2)
得到结果:
最后是对数据框按合同号和催收时间进行排序,取最后一条催收记录,代码如下:
data3 = data2.sort_values(by=['合同号', '催收时间'],ascending=[False, False]) data3 = data3.groupby('合同号',as_index=False).first() print(data2.shape) print(data3.shape)
得到结果:
(1744, 8)
(1455, 8)
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
长按识别二维码并关注微信
更方便到期提醒、手机管理