python 批量导入MongoDB数据库
2014-03-31 20:33
417 查看
由于 源文件 不是 MongoDB 支持的JSON 和 BSON 格式的数据, 所以只能将 源数据 转变格式后, 用脚本 将其导入,所测数据为中科院信工所提供的数据。(这也是在信工所接触的第一个写程序的活。)源码如下:
#!/usr/bin/env python #encoding:utf-8 ################################### # function: analysis the log in the 'die' to JSON , and #output the data to the MongoDB. # data: 2014/3/31 #History: 1.0 ################################### import os import pymongo def connect_mongodb(): servers="mongodb://localhost:27017" conn = pymongo.Connection(servers) print conn.database_names() db = conn.my_mongodb #连接库 return db def str_process(string,db): d={} if string == '\n': return string2=str(string) print '-----'+string string2=string2.split(' ') print '---------------' print string2 for i in string2: print i print '------------' string2[3].split('\n') d['projectcode']=string2[0] d['pagename']=string2[1] d['pageview']=string2[2] d['bytes']=string2[3][:-1] db.user.insert(d) def file_process(source_file,db): string2='' f=open(source_file,'r') print 'file name :'+source_file while True: string2=f.readline() if string2 == '': break string2=str_process(string2,db) print string2 def get_dir_list(dir): #input the dir ,will output the all filename dat0=[] for i in os.listdir(dir): dat0.append(i) return dat0 def all_file_process(): dir_file_name='' dir_list=[] dir_file_name=raw_input('please input the dir name:') dir_list=get_dir_list(dir_file_name) print dir_list db=connect_mongodb() for i in dir_list: if str(i) != 'log_file_process.py': file_process(str(i),db) all_file_process()
相关文章推荐
- mongoDB的Find详解、分页和排序、游标
- mongodb的主从复制操作
- mongodb数据的导入导出,备份恢复
- PHP操作mongoDB 笔记
- mongodb update操作
- mongoDB的shell
- MongoDB简介
- 如何在Ubuntu 12.04上安装MongoDB?
- mongodb一个关键字对多个字段同时查询,mongodb $or $and查询
- mongodb连接操作
- MySQL MongoDB SQL 对应
- mongodb操作文件
- 基于java实现mongodb的数据库连接池
- mongoDB的shell的基本操作
- window mongodb的安装
- 搭建高可用mongodb集群(四)—— 分片
- MongoDB数据库简介及安装
- mongoDB的MapReduce简介
- Mongodb复制集以及sharding的实现 推荐
- 关于MongoDB你需要知道的几件事