获取用户的平均在线时间_python

我受命处理看起来像这样的日志文件：

bob logged-in 11:21:01 pm
bob logged-out 11:23:22 pm 
alice logged-in 11:24:12 pm
jane logged-in 11:31:00 pm
alice logged-out 11:34:20 pm
jane logged-out 11:55:00 pm
bob logged-n 11:56:01 pm

等等等

我需要创建一个脚本来显示平均登录时间。 输出应如下所示：

jane: 12.5 mins
alice: 2.3 mins
bob: 2.2 mins

一个用户可以多次登录。 该文件按时间排序，并且登录/注销条目不是顺序的。

我正在寻找一种bash或python解决方案，即使没有解决困难的时间戳的问题（假设我已经找到了一种将类似的部分时间戳转换为纪元格式的方法）的方法。

任何帮助，将不胜感激。

假设每次用户登录后，他应该先注销然后再登录，您可以这样做。

进行2个循环，第一个循环捕获所有登录，第二个循环捕获所有注销

您的设置应如下所示：

from datetime import datetime
from functools import  reduce
lines = []
with open('logs.txt', 'r') as f:
    lines = f.readlines()

times = {}

您的第一个循环应如下所示：

for i in range(len(lines)):
    split_login = lines[i].split(' ')
    if split_login[1] != 'logged-in':
        continue
    name = split_login[0]
    # take the login time from the splitted line
    login_time = split_login[2] + split_login[3].replace('\n', '')
    # converted to datetime object
    login_time = datetime.strptime(login_time, '%I:%M:%S%p')
    # create dictionary in times dictionary where you store time per user
    if name not in times:
        times[name] = {'times': [], 'avg': 0}

现在，第二个循环应该是一个内部循环，该循环将从第一个循环所在的索引开始。

    for ii in range(len(lines)):
        if i+ii+1 < len(lines):
            split_logout = lines[ii+i+1].split(' ')
            if split_logout[0] == name:
                # take the logout time from the splitted line
                logout_time = split_logout[2] + split_login[3].replace('\n', '')
                # convert to datetime object
                logout_time = datetime.strptime(logout_time, '%I:%M:%S%p')
                # calc how long the login was
                time_logged = logout_time - login_time
                # append to the times of the user
                times[name]['times'].append(time_logged.total_seconds())
                # get the average
                times[name]['avg'] = reduce(lambda x, y: x + y, times[name]['times']) / len(times[name]['times'])
                break
#print the avg times per user
for k, v in times.items():
    print('%s: %d' % (k, v['avg']/60))

这只是一个简单而又肮脏的示例，我敢肯定有更好的方法，当然，由于有些重复，可以清除代码。

获取用户的平均在线时间

问题描述

1楼