您的位置:首页 > 编程语言 > Python开发

Python-网站日志分析

2013-01-29 23:46 218 查看
针对自己的网站日志分析做了个小插件:

import time

li = [['robots', 'robots.txt', 0], ['pd_1', '-Catalog/', 0], ['pd_2', '/catalog/', 0], ['qp1_1', '/hot-china-products/', 0], ['qp1_2', '/find-china-products/', 0], ['qp2', '-ns/', 0], ['qd_sp', '/manufacturers-directory/', 0], ['qp_sp', '/manufacturers-search/', 0], ['inquiry', '/sendInquiry/', 0], ['fr_pd', '/product-detail', 0], ['fr_comp', '/companyinfo/', 0], ['fr_pl', '/product-list', 0], ['fr_pind', '/products/index.html', 0], ['fr_ol', '/offer-list/', 0], ['fr_off', '/offer-detail', 0]]
all = 0
home = 0
f = open('gbwww.txt')
startTime = time.clock()
for ln in f.readlines():
ln = ln.split()[2]
all += 1
for n in li:
if n[1] in ln:
n[2] += 1
break
if ln == '/':
home += 1

endTime = time.clock()
f.close()

print 'all - ', all
print 'home - ', home
for n in li:
print n[0], '-', n[2]

print 'all time is', (endTime - startTime)


只是雏形,尚未完善,仅供参考。

1月30日补充:

1、加入了时间,可测试花费了多长时间。

2、更新了列表规则,可统计更多内容。

问题:

还有2个内容没法统计,主要是用到了正则,打算等看到正则一段补充上。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: