python elasticsearch 批量写入数据

from elasticsearch import Elasticsearch

from elasticsearch import helpers

import pymysql

import time

# 连接ES

es = Elasticsearch(

    ['127.0.0.1'],

    port=9200

)

# 连接MySQL

print("Connect to mysql...")

mysql_db = "test"

m_conn = pymysql.connect('localhost', 'root', '数据库密码', 'table表')

m_cursor = m_conn.cursor()

try:

    num_id = 0

    while True:

        s = time.time()

        # 查询数据

        sql = "select good_id, title,description from goods LIMIT {}, 100000".format(num_id*100000)

        # 这里假设查询出来的结果为 张三 26 北京

        m_cursor.execute(sql)

        query_results = m_cursor.fetchall()

        if not query_results:

            print("MySQL查询结果为空 num_id=<{}>".format(num_id))

            break

        else:

            actions = []

            for line in query_results:

            # 拼接插入数据结构

                action = {

                    "_index": "tenco2019",

                    "_type": "goods",

                    "_id":line[0],

                    "_source": {

                        "good_title": line[1],

                        "good_description": line[2],

                    }

                }

                # 形成一个长度与查询结果数量相等的列表

                actions.append(action)

            # 批量插入

            a = helpers.bulk(es, actions)

            e = time.time()

            print("{} {}s".format(a, e-s))

        num_id += 1

finally:

    m_cursor.close()

    m_conn.close()

    print("MySQL connection close...")

python elasticsearch 批量写入数据的更多相关文章

使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历
原文:使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历常常遇到需要向SQL Server插入批量数据,然后在存储过程中对这些数据进行进一步处理的情况.存储过 ...
HBase BulkLoad批量写入数据实战
1.概述在进行数据传输中,批量加载数据到HBase集群有多种方式,比如通过HBase API进行批量写入数据.使用Sqoop工具批量导数到HBase集群.使用MapReduce批量导入等.这些方式, ...
MSSQL批量写入数据方案
近来有一个项目Feature需要有批量写入数据的场景,正巧整理资料发现自己以前也类似实现的项目,在重构的同时把相关资料做了一个简单的梳理,方便大家参考. 循环写入(简单粗暴,毕业设计就这样干的)(不推 ...
使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历
使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历原文:使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历常常遇 ...
Elasticsearch 5.4.3实战--Java API调用：批量写入数据
这个其实比较简单,直接上代码. 注意部分逻辑可以换成你自己的逻辑 package com.cs99lzzs.elasticsearch.service.imp; import java.sql.Tim ...
python脚本批量生成数据
在平时的工作中,经常会遇到造数据,特别是性能测试的时候更是需要大量的数据.如果一条条的插入数据库或者一条条的创建数据,效率未免有点低.如何快速的造大量的测试数据呢?在不熟悉存储过程的情况下,今天给大家 ...
python 使用xlsxwriter 写入数据时，当数据中链接的后面包含空格时（如："http://*** "），导出问题打开报错
python 在使用 xlsxwriter组件写入数据时,当数据包含类似“http://*** /”数据时,导出的excel,打开时会提示如下错误: 没有查到相关的资料处理这个问题,可能原因为exce ...
java连接mysql批量写入数据
1.采用公认的MYSQL最快批量提交办法 public void index() throws UnsupportedEncodingException, Exception { //1000个一提交 ...
用Python简单批量处理数据
近期碰到一个问题,两套系统之间数据同步出了差错,事后才发现的,又不能将业务流程倒退,但是这么多数据手工处理量也太大了,于是决定用Python偷个小懒. 1.首先分析数据. 两边数据库字段的值都是一样, ...

随机推荐

vscode中vue代码颜色插件
vue提示插件[Vscode] 编者寄语:vscode的确是前端开发中很好的工具,安装颜色插件,从视觉上是美的享受.曾经的我遇到了vscode代码全是灰色,黑色的困惑,后来整理找到方法,整 ...
python的numpy库的学习
1.创建 array(序列类型).asarray.arange.ones.ones_like.zeros.zeros_like.empty.empty_like.eye.identity 2.运算两 ...
SpringMVC：处理静态资源
方法1.采用<mvc:default-servlet-handler/> 若将 DispatcherServlet 请求映射配置为 /,则 Spring MVC 将捕获WEB 容器的所有请 ...
Hanlp学习笔记
一.首先要引入mawen依赖包: <dependency> <groupId>com.hankcs</groupId> <artifactId>hanl ...
【Windows】JDK安装与环境变量配置
一.JDK下载 jdk有多个版本: java se开发包:Java SE Development Kit 8u25 ,必须的配置Java开发环境的.java se开发包+示例:Java SE Deve ...
Servlet校验密码之Mariadb篇
Servlet校验密码之Mariadb篇先放图-- 数据库: 效果图: 整体来说与上一篇差距不大,这次主要是采用数据库来进行校验,我使用的是Mariadb,安装与配置不用我说主要有一点,导入连接器 ...
nginx 平滑更新
1.更新nginx源 #centos6的nginx源 #centos7的话吧url 的6改为7就行了 vim /etc/yum.repos.d/nginx.repo [nginx] name=ngin ...
unity3d优化-代码篇（不定期更新）
1.Update 大多数情况是需要在update中处理很多逻辑的,然而unity3d底层是c/c++编写,逻辑层是c#,通过monobehaviour挂载于对象中,实现一些unity3d接口的重载. ...
开发中常用的JS知识点集锦
索引 1.对象深拷贝 2.网络图片转base64, 在线图片点击下载 3.常用CSS样式记录(超出宽高省略展示/播放icon/按钮背景颜色渐变...) 4.对象深拷贝 5.对象深拷贝 6.对象深拷贝 ...
labview下载地址
ftp://ftp.ni.com/evaluation/labview/ekit/other/downloader

python elasticsearch 批量写入数据

python elasticsearch 批量写入数据的更多相关文章

随机推荐

热门专题