Spark连接MongoDB之Scala

MongoDB Connector for Spark
　　Spark Connector Scala Guide

spark-shell --jars "mongo-spark-connector_2.11-2.0.0.jar,mongo-hadoop-core-2.0.2.jar,mongo-java-driver-3.4.2.jar"

import org.apache.spark.sql.SparkSession

import com.mongodb.spark._

import com.mongodb.spark.config._

import org.bson.Document

    val spark = SparkSession.builder()

      .master("local")

      .appName("MongoSparkConnector")

      .config("spark.some.config.option", "some-value")

      .getOrCreate()

val uri = "mongodb://172.1.1.1:27017"

    val userDF = spark.sql("""

select

       uid,

       name,

       current_date() version

  from test_table

  limit 100

      """).repartition(8)

// Write to MongoDB

    userDF.write.mode("overwrite").format("com.mongodb.spark.sql").options(

      Map(

        "uri" -> uri,

        "database" -> "test",

        "collection" -> "test_table")).save()

// Read From MongoDB

    val df = spark.read.format("com.mongodb.spark.sql").options(

      Map(

        "uri" -> uri,

        "database" -> "test",

        "collection" -> "test_table")).load()

// 其他方式

    userDF.write.mode("overwrite").format("com.mongodb.spark.sql").options(

      Map(

        "spark.mongodb.input.uri" -> uri,

        "spark.mongodb.output.uri" -> uri,

        "spark.mongodb.output.database" -> "test",

        "spark.mongodb.output.collection" -> "test_table")).save()

    MongoSpark.save(

      userDF.write.mode("overwrite").options(

        Map(

          "spark.mongodb.input.uri" -> uri,

          "spark.mongodb.output.uri" -> uri,

          "spark.mongodb.output.database" -> "test",

          "spark.mongodb.output.collection" -> "test_table")))

    MongoSpark.save(

      userDF.write.mode("overwrite").options(

        Map(

          "uri" -> uri,

          "database" -> "test",

          "collection" -> "test_table")))

    spark.stop()

Spark连接MongoDB之Scala的更多相关文章

spark连接mongodb
1.添加依赖 hadoop和mongodb的连接器 <dependency> <groupId>org.mongodb.mongo-hadoop</groupId> ...
记录一次spark连接mysql遇到的问题
版权声明:本文为博主原创文章,未经博主允许不得转载在使用spark连接mysql的过程中报错了,错误如下 08:51:32.495 [main] ERROR - Error loading fact ...
spark SQL学习（spark连接 mysql）
spark连接mysql(打jar包方式) package wujiadong_sparkSQL import java.util.Properties import org.apache.spark ...
spark SQL学习（spark连接hive）
spark 读取hive中的数据 scala> import org.apache.spark.sql.hive.HiveContext import org.apache.spark.sql. ...
【原创】大叔经验分享（55）spark连接kudu报错
spark-2.4.2kudu-1.7.0 开始尝试 1)自己手工将jar加到classpath spark-2.4.2-bin-hadoop2.6+kudu-spark2_2.11-1.7.0-cd ...
nodejs连接mongodb的方法
一. var express = require('express'); var mongodb = require('mongodb'); var app = express(); app.use( ...
Nodejs开发(2.连接MongoDB)
一.先配置MongoDB Win10下下载那个安装版,zip版的会报却各种DLL,安装在你希望的路径,实在安装错了,就剪切过来也行(本例E:\mongodb). 然后是配置启动脚本,就是写一个bat文 ...
在express中使用Mongoose连接MongoDB
为何要学Mongoose? Mongoose是MongoDB的一个对象模型工具,封装了MongoDB对文档的的一些增删改查等常用方法,让NodeJS操作Mongodb数据库变得更加灵活简单. 0.安装 ...
java连接mongodb的一个奇葩问题及奇葩解决方式
昨天在eclipse中编写代码,本来连接mongodb进行各项操作都是正常的,但是有一会儿突然之间就没法连接了,还一直抱错,错误如下: 信息: Cluster created with setting ...

随机推荐

jQusery .基础
1.jQusery 的基本用法 <%@ page language="java" contentType="text/html; charset=UTF-8&quo ...
GMA Round 1 三视图
传送门三视图该几何体如图所示,是一个边长为$2\sqrt{3}$的正四面体,高是$h=2\sqrt{2}$,内切球半径是$r=\frac{h}{4}=\frac{\sqrt{2}}{2}$,则体积 ...
js-重写jquery的ajax中的内容
/** * 测试 * 2018/1/8 13:40 lee.wangel */ (function($){ //备份jquery的ajax方法 var _ajax=$.ajax; //重写jquery ...
Lazarus 初识
Lazarus 使用 Free Pascal 的编译器,支持 Object Pascal 语言,与 Delphi 高度兼容,并看做后者的自由软件替代品. Lazarus 下载与安装我们先去 Laza ...
angualrjs 配置超时时间
timeout 1 本想通过$httpProvider的defaults属性配置timeout时间, defaults中没有这个属性. https://docs.angularjs.org/api/n ...
py3下怎么用StringIO
try: from StringIO import StringIO except ImportError: from io import StringIO
linux软连接
linux软连接.类似window的快捷方式可以跨磁盘块(硬连接不可以). #软硬链接 ln -sf source target ln source target #硬链接不能跨分区 #批量解压文件 ...
【Python】解析Python的缩进规则
Python中的缩进(Indentation)决定了代码的作用域范围.这一点和传统的c/c++有很大的不同(传统的c/c++使用花括号花括号{}符决定作用域的范围:python使用缩进空格来表示作用域 ...
Effective Java 第三版——81. 优先使用并发实用程序替代wait和notify
Tips 书中的源代码地址:https://github.com/jbloch/effective-java-3e-source-code 注意,书中的有些代码里方法是基于Java 9 API中的,所 ...
C++ thread类多线程编程
https://blog.csdn.net/dcrmg/article/details/53912941 多线程操作的thread类,简单多线程示例: #include <iostream> ...

Spark连接MongoDB之Scala

Spark连接MongoDB之Scala的更多相关文章

随机推荐

热门专题