Python从MongoDB中按天读取数据并格式化日志

#$cat SpeechMongoHandle.py

from pymongo import Connection

import time

import datetime

# CTRL_A='\x01'

# CTRL_B='\x02'

CTRL_A='--'

def getEveryDay(begin_date,end_date):

    date_list = []

    begin_date = datetime.datetime.strptime(begin_date, "%Y-%m-%d")

    end_date = datetime.datetime.strptime(end_date,"%Y-%m-%d")

    while begin_date < end_date:

        # date_str = begin_date.strftime("%Y-%m-%d")

        mid_date = begin_date + datetime.timedelta(days=1)

        tup = (str(begin_date),str(mid_date))

        date_list.append(tup)

        begin_date = mid_date

    return date_list

days = getEveryDay('2017-01-01','2017-01-02')

# MongoDB Connect

client = Connection('syslog-1',27017)

db_name = 'service'

db = client[db_name]

collection = db.speech

for day in days:

    tmpArray0 = time.strptime(str(day[0]), "%Y-%m-%d %H:%M:%S")

    tmpArray1 = time.strptime(str(day[1]), "%Y-%m-%d %H:%M:%S")

    timestamp0 = int(time.mktime(tmpArray0)*1000)

    timestamp1 = int(time.mktime(tmpArray1)*1000)

    print day

    print (timestamp0,timestamp1)

    results = collection.find({"time":{'$gte':timestamp0,'$lt':timestamp1}})

    for res in results:

        keys = res.keys()

        if "time" in keys:

            unixtimestamp = str(int(res["time"]))

            timetemp = time.localtime(int(unixtimestamp)/1000)

            thedate = time.strftime("%Y-%m-%d %H:%M:%S", timetemp)

        if "id" in keys:

            sn = res["id"]

        if "asr" in keys:

            asr = res["asr"]

        if "nlp" in keys:

            nlp = res["nlp"]

        if "domain" in keys:

            domain = res["domain"]

        if "intent" in keys:

            intent = res["intent"]

        print thedate + CTRL_A + sn + CTRL_A + asr + CTRL_A + nlp + CTRL_A + domain + CTRL_A + intent

应对场景为：MongoDB中历史数据巨多接近一年多，需要想办法将数据读出并且格式化上传到集群上。就想出了按天读取数据

或许还有最优解。。。

Python从MongoDB中按天读取数据并格式化日志的更多相关文章

python之从文件中按行读取数据
#!/usr/bin/env python3 # -*- coding: utf-8 -*- __author__ = 'jiangwenwen' # 从文件中按行读取数据 file = open(& ...
struts2中从后台读取数据到<s:select>
看到网上好多有struts2中从后台读取数据到<s:select>的,但都不太详细,可能是我自己理解不了吧!所以我自己做了一个,其中可能有很多不好的地方,望广大网友指出结果如图 p ...
python操作MONGODB数据库，提取部分数据再存储
目标:从一个数据库中提取几个集合中的部分数据,组合起来一共一万条.几个集合,不足一千条数据的集合就全部提取,够一千条的就用一万减去不足一千的,再除以大于一千的集合个数,得到的值即为所需提取文档的个数. ...
使用aggregate在MongoDB中查找重复的数据记录
我们知道,MongoDB属于文档型数据库,其存储的文档类型都是JSON对象.正是由于这一特性,我们在Node.js中会经常使用MongoDB进行数据的存取.但由于Node.js是异步执行的,这就导致我 ...
Python（Redis 中 Set/Zset 类型数据和其他操作）
1.redis 基本操作命令 Set 操作 Set 集合就是不允许重复的列表无序集合 sadd(name,values) 给 name 对应的集合中添加 1 个或多个元素 import redis ...
gin中从reader读取数据数据
package main import ( "fmt" "github.com/gin-gonic/gin" "net/http" &quo ...
Python学习笔记_从CSV读取数据写入Excel文件中
本示例特点: 1.读取CSV,写入Excel 2.读取CSV里具体行.具体列,具体行列的值一.系统环境 1. OS:Win10 64位英文版 2. Python 3.7 3. 使用第三方库:csv. ...
python 去除Excel中的重复行数据
导入pandas import pandas as pd 1.读取excel中的数据: frame = pd.DataFrame(pd.read_csv('excel的绝对路径.csv'', 'She ...
Node.js向MongoDB中插入并查询数据
首先必须要保持Node.js与MongoDB保持连接具体教程见:Node.js连接MongoDB数据库步骤插入数据步骤如下 node项目文件如下:在routes文件夹下新建insert.js文件, ...

随机推荐

rarcrack
apt-get install rarcrack使用方法:rarcrack --threads xx --type rar xx.rar
json(JavaScript Object Natation)学习
Json必需的包: commons-httpclient-3.1.jar commons-lang-2.4.jar commons-logging-1.1.1.jar json-lib-2.2.3-j ...
exception http://java.sun.com/jsp/jstl/core cannot be resolved in either web.xml or the jar files deployed with this application
http://java.sun.com/jsp/jstl/core cannot be resolved in either web.xml or the jar files deployed w ...
python之函数用法locals()
# -*- coding: utf-8 -*- #python 27 #xiaodeng #python之函数用法locals() #locals() #说明:查找局部变量,返回一个名字/值对的字典对 ...
python线程详解
#线程状态 #线程同步(锁)#多线程的优势在于可以同时运行多个任务,至少感觉起来是这样,但是当线程需要共享数据时,可能存在数据不同步的问题. #threading模块#常用方法:'''threadin ...
linux limits.conf 配置
转自:http://kerry.blog.51cto.com/172631/300784 limits.conf 文件实际是 Linux PAM(插入式认证模块,Pluggable Authentic ...
微信小程序基于scroll-view实现锚点定位
代码地址如下:http://www.demodashi.com/demo/14009.html 一.前期准备工作软件环境:微信开发者工具官方下载地址:https://mp.weixin.qq.co ...
ASP.NET DataBase
//数据库操作 public class DataBase { private SqlConnection conn;//数据库连接对象 #region 打开数据库连接 private void Op ...
POJ 1364 King （差分约束）
King Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 8660 Accepted: 3263 Description ...
Android——点击对话框上按钮不关闭对话框
有时候我没可能需要在点击按钮进行一些检测,但是并不想关闭次对话框(系统默认点击任何一个按钮则关闭对话框),处理方法如下:在点击事件下添加如下代码: try { Field field = dialog ...

Python从MongoDB中按天读取数据并格式化日志

Python从MongoDB中按天读取数据并格式化日志的更多相关文章

随机推荐

热门专题