FunDA（12）－示范：强类型数据源

FunDA设计的主要目的是解决FRM（Functional Relation Mapping）如Slick这样的批次型操作工具库数据源行间游动操作的缺失问题。FRM产生的结果集就是一种静态集合，缺乏动态更新操作方式。FunDA提出的解决方案是把FRM产生的静态集合转变成动态流（stream）,流内元素代表数据行（data row）,一个完整的数据流代表一连串的数据行。用户可以利用数据流和FunDA提供的函数组件在数据流中游动进行数据更新操作。FunDA的数据流只支持单向游动（fda_next），但FunDA的数据流支持多种类型的数据元素，包括：数据行（data row）和指令行（action row）。指令行ActionRow是由Slick-DBIOAction构成，可以发送回后台数据库更新数据。FunDA可以通过函数组件从数据行中产生新数据行或者指令行并且在数据流的任何位置运算用户提供的功能函数，使其能使用该位置的数据行进行数据更新或者数据（指令）行产生操作。我们将在下面几个章节进行FunDA功能的使用示范。

Slick运算Query返回的结果集合内的数据行类型一般是Tuple类型。因为无法使用字段名，是弱类型。除了从方便使用角度考虑，还因为FunDA开发是基于Scala函数式编程模式的，静态类型系统（static type system）对类型要求比较严格，所以FunDA的数据流内元素必须是强类型的，大部分是case class类型。这样用户可以使用名称来调用数据字段来进行数据处理编程。下面我们就示范一下如何把Slick的数据结果集合转变成强类型数据流：

从世界银行公开数据网站下载了一份美国州县空气质量报告原始数据，cvs格式的，30万条左右。导入h2数据库后作为示范数据。下面是示范数据表结构：

import slick.driver.H2Driver.api._

object Models {

  //表字段对应模版

  case class AQMRawModel(mid: String

                         , mtype: String

                         , state: String

                         , fips: String

                         , county: String

                         , year: String

                         , value: String)

  //表结构: 定义字段类型, * 代表结果集字段

  class AQMRawTable(tag: Tag) extends Table[AQMRawModel](tag, "AIRQM") {

    def mid = column[String]("MEASUREID")

    def mtype = column[String]("MEASURETYPE")

    def state = column[String]("STATENAME")

    def fips = column[String]("COUNTYFIPS")

    def county = column[String]("COUNTYNAME")

    def year = column[String]("REPORTYEAR")

    def value = column[String]("VALUE")

    def * = (mid,mtype,state,fips,county,year,value) <> (AQMRawModel.tupled, AQMRawModel.unapply)

  }

  //库表实例

  val AQMRawQuery = TableQuery[AQMRawTable]

}

下面是这个示范软件的sbt设置文件build.sbt：

name := "funda-demo"

version := "1.0"

scalaVersion := "2.11.8"

resolvers += Resolver.mavenLocal

libraryDependencies ++= Seq(

  "com.typesafe.slick" %% "slick" % "3.1.1",

  "com.typesafe.slick" %% "slick-testkit" % "3.1.1" % "test",

  "org.slf4j" % "slf4j-nop" % "1.7.21",

  "com.h2database" % "h2" % "1.4.191",

  "com.typesafe.slick" %% "slick-hikaricp" % "3.1.1",

  "com.bayakala" % "funda_2.11" % "1.0.0-SNAPSHOT" withSources() withJavadoc()

)

数据库设置在前面Slick系列讨论里已经示范过了。在这里就不再多说了。

强类型转换可以在读取数据库时进行，生成强类型元素的数据流。或者在使用数据流时即时转换。我们先看看如何构建强类型元素数据流：

  val aqmraw = Models.AQMRawQuery

  val db = Database.forConfig("h2db")

// aqmQuery.result returns Seq[(String,String,String,String)]

  val aqmQuery = aqmraw.map {r => (r.year,r.state,r.county,r.value)}

// user designed strong typed resultset type. must extend FDAROW

  case class TypedRow(year: String, state: String, county: String, value: String) extends FDAROW

// strong typed resultset conversion function. declared implicit to remind during compilation

  implicit def toTypedRow(row: (String,String,String,String)): TypedRow =

    TypedRow(row._1,row._2,row._3,row._4)

在读取数据库前用户提供强类型结构case class TypedRow, 及Seq[(...)]到TypeRow类型转换函数toTypedRow，如上。在构建数据读取工具类FDAViewLoader时提供这个转换函数：

// loader to read from database and convert result collection to strong typed collection

  val viewLoader = FDAViewLoader(slick.driver.H2Driver)(toTypedRow _)

  val dataSeq = viewLoader.fda_typedRows(aqmQuery.result)(db).toSeq

现在这个dataSeq是Seq[TypedRow]类型了。用dataSeq构建静态数据流：

// turn Seq collection into fs2 stream

  val aqmStream =  fda_staticSource(dataSeq)()()

fd_staticSource是基于bracket函数的资源使用模式：

  /**

    * produce a static view source from a Seq[ROW] collection using famous 'bracket'

    * provide facade to error handling and cleanup

    * @param acquirer       the Seq[ROW] collection

    * @param errhandler     error handle callback

    * @param finalizer      cleanup callback

    * @tparam ROW           type of row

    * @return               a new stream

    */

  def fda_staticSource[ROW](acquirer: => Seq[ROW])(

                            errhandler: Throwable => FDAPipeLine[ROW] = null)(

                            finalizer: => Unit = ()): FDAPipeLine[ROW] = {...}

上面的调用省略了异常和事后处理。下面的例子示范了完整的调用：

  val safeSource = fda_staticSource(dataSeq) {

    case e: Exception => fda_appendRow(FDAErrorRow(new Exception(e)))

  }(println("the end finally!"))

在这个调用例子里如果出现异常，新数据流状态是一个代表异常的元素类型。无论在正常完成或中断情况下都会显示“the end finally!“信息。

aqmStream是个一个以TypedRow为元素的强类型数据流。我们可以在组件函数里使用字段名：

  // use stream combinators with field names

  aqmStream.filter{r => r.year > ""}.take().appendTask(showRecord).startRun

当然我们也可以在用户定义的任务FDAUserTask函数中调用字段名：

// now access fields in the strong typed resultset

  def showRecord: FDAUserTask[FDAROW] = row => {

    row match {

      case qmr: TypedRow =>

        println(s"州名: ${qmr.state}")

        println(s"县名：${qmr.county}")

        println(s"年份：${qmr.year}")

        println(s"取值：${qmr.value}")

        println("-------------")

        fda_skip

      case _ => fda_skip

    }

  }

运算aqmStream得出以下结果：

州名: Ohio

县名：Stark

年份：

取值：

-------------

州名: New Mexico

县名：Lea

年份：

取值：

-------------

州名: Texas

县名：Bowie

年份：

取值：

-------------

Process finished with exit code

我们也可以先构建一个弱类型数据流后再用map来把它转换成强类型的，如下：

  val allState = aqmraw.map(_.state)

  val stateLoader = FDAViewLoader[String,String](slick.driver.H2Driver)()

  val stateSeq = stateLoader.fda_plainRows(allState.distinct.result)(db).toSeq

  val stateStream =  fda_staticSource(stateSeq)()()

  case class StateRow(state: String) extends FDAROW

  def showState: FDAUserTask[FDAROW] = row => {

     row match {

       case StateRow(sname) =>

         println(s"州名称：$sname")

         fda_skip

       case _ => fda_skip

     }

  }

  stateStream.map{s => StateRow(s)}

    .filter{r => r.state > "Alabama"}.take()

    .appendTask(showState).startRun

allState返回结果类型Seq[String]。注意如果没有提供类型转换函数来辅助类型推导就必须在构建FDAViewLoader时提供SOURCE和TARGET类型参数。stateStream是一个弱类型的数据流，我们用map{s => StateRow(s))把流元素转换成StateRow类型。运算stateStream结果为：

州名称：North Dakota

州名称：Maryland

州名称：Louisiana

Process finished with exit code

上面的示范例子我们可以用Reactive-Streams方式实现，如下：

  val streamLoader = FDAStreamLoader(slick.driver.H2Driver)(toTypedRow _)

  val streamSource = streamLoader.fda_typedStream(aqmQuery.result)(db)(

    .seconds,,)()()

  streamSource.filter{r => r.year > ""}.take().appendTask(showRecord).startRun

  val stateStreamLoader = FDAStreamLoader[String,String](slick.driver.H2Driver)()

  val stateStreamSource = stateStreamLoader.fda_plainStream(allState.distinct.result)(db)(

    .seconds,,)()()

  //first convert to StateRows to turn Stream[Task,FDAROW] typed stream

  stateStreamSource.map{s => StateRow(s)}

    .filter{r => r.state > "Alabama"}.take()

    .appendTask(showState).startRun

}

fda_typeStream产生强类型元素的数据流。它的函数款式是这样的：

   /**

      * returns a reactive-stream from Slick DBIOAction result

      * using play-iteratees and fs2 queque to connect to slick data stream publisher

      * provide facade for error handler and finalizer to support exception and cleanup handling

      * also provide stream element conversion from SOURCE type to TARGET type

      * @param action       a Slick DBIOAction to produce query results

      * @param slickDB      Slick database object

      * @param maxInterval  max time wait on iteratee to consume of next element

      *                     exceeding presumed streaming failure or completion

      *                     use 0.milli to represent infinity

      *                     inform enumerator to release its resources

      * @param fetchSize    number of rows cached during database read

      * @param queSize      size of queque used by iteratee as cache to pass elements to fs2 stream

      * @param errhandler   error handler callback

      * @param finalizer    cleanup callback

      * @param convert      just a measure to guarantee conversion function is defined

      *                     when this function is used there has to be a converter defined

      *                     implicitly in compile time

      * @return             a reactive-stream of TARGET row type elements

      */

    def fda_typedStream(action: DBIOAction[Iterable[SOURCE],Streaming[SOURCE],Effect.Read])(

      slickDB: Database)(

      maxInterval: FiniteDuration, fetchSize: Int, queSize: Int)(

      errhandler: Throwable => FDAPipeLine[TARGET] = null)(

      finalizer: => Unit = ())(

      implicit convert: SOURCE => TARGET): FDAPipeLine[TARGET] = {...}

注意maxInterval,fetchSize,queSize这几个参数的用途。上面这个streaming的示范例子产生相同结果。

下面是示范源代码：

import slick.driver.H2Driver.api._

import com.bayakala.funda._

import API._

import scala.language.implicitConversions

import scala.concurrent.duration._

object StrongTypedSource extends App {

  val aqmraw = Models.AQMRawQuery

  val db = Database.forConfig("h2db")

// aqmQuery.result returns Seq[(String,String,String,String)]

  val aqmQuery = aqmraw.map {r => (r.year,r.state,r.county,r.value)}

// user designed strong typed resultset type. must extend FDAROW

  case class TypedRow(year: String, state: String, county: String, value: String) extends FDAROW

// strong typed resultset conversion function. declared implicit to remind during compilation

  implicit def toTypedRow(row: (String,String,String,String)): TypedRow =

    TypedRow(row._1,row._2,row._3,row._4)

// loader to read from database and convert result collection to strong typed collection

  val viewLoader = FDAViewLoader(slick.driver.H2Driver)(toTypedRow _)

  val dataSeq = viewLoader.fda_typedRows(aqmQuery.result)(db).toSeq

// turn Seq collection into fs2 stream

  val aqmStream =  fda_staticSource(dataSeq)()()

// now access fields in the strong typed resultset

  def showRecord: FDAUserTask[FDAROW] = row => {

    row match {

      case qmr: TypedRow =>

        println(s"州名: ${qmr.state}")

        println(s"县名：${qmr.county}")

        println(s"年份：${qmr.year}")

        println(s"取值：${qmr.value}")

        println("-------------")

        fda_skip

      case _ => fda_skip

    }

  }

  // use stream combinators with field names

  aqmStream.filter{r => r.year > ""}.take().appendTask(showRecord).startRun

  val allState = aqmraw.map(_.state)

  //no converter to help type inference. must provide type parameters explicitly

  val stateLoader = FDAViewLoader[String,String](slick.driver.H2Driver)()

  val stateSeq = stateLoader.fda_plainRows(allState.distinct.result)(db).toSeq

  //constructed a Stream[Task,String]

  val stateStream =  fda_staticSource(stateSeq)()()

  //strong typed row type. must extend FDAROW

  case class StateRow(state: String) extends FDAROW

  def showState: FDAUserTask[FDAROW] = row => {

     row match {

       case StateRow(sname) =>

         println(s"州名称：$sname")

         fda_skip

       case _ => fda_skip

     }

  }

  //first convert to StateRows to turn Stream[Task,FDAROW] typed stream

  stateStream.map{s => StateRow(s)}

    .filter{r => r.state > "Alabama"}.take()

    .appendTask(showState).startRun

  val streamLoader = FDAStreamLoader(slick.driver.H2Driver)(toTypedRow _)

  val streamSource = streamLoader.fda_typedStream(aqmQuery.result)(db)(

    .seconds,,)()()

  streamSource.filter{r => r.year > ""}.take().appendTask(showRecord).startRun

  val stateStreamLoader = FDAStreamLoader[String,String](slick.driver.H2Driver)()

  val stateStreamSource = stateStreamLoader.fda_plainStream(allState.distinct.result)(db)(

    .seconds,,)()()

  //first convert to StateRows to turn Stream[Task,FDAROW] typed stream

  stateStreamSource.map{s => StateRow(s)}

    .filter{r => r.state > "Alabama"}.take()

    .appendTask(showState).startRun

}

FunDA（12）－示范：强类型数据源 - strong typed data sources的更多相关文章

Weblogic多数据源（Multi Data Sources）应用实践
原创 2012年03月29日 10:55:28 标签: weblogic / 数据库 / 负载均衡 / 数据中心 / jdbc / 应用服务器大型系统在进行数据库部署时,常常会分为主数据应用中心 ...
Spark SQL 之 Data Sources
#Spark SQL 之 Data Sources 转载请注明出处:http://www.cnblogs.com/BYRans/ 数据源(Data Source) Spark SQL的DataFram ...
Spark SQL External Data Sources JDBC简易实现
在spark1.2版本中最令我期待的功能是External Data Sources,通过该API可以直接将External Data Sources注册成一个临时表,该表可以和已经存在的表等通过sq ...
JasperReports教程：Report Data Sources
原文地址:http://www.tutorialspoint.com/jasper_reports/jasper_report_data_sources.htm Datasources是一个结构化的数 ...
Windows系统自带的ODBC Data Sources的配置及使用
一直不明白ODBC是个什么东东,虽然一次次碰到,却从没用过,看Wikipedia上的描述,可以访问各种数据库.Excel.CSV等,可以剥离数据库和操作系统依赖,简直神乎其神.不过这样的描述太抽象概括 ...
Spark SQL External Data Sources JDBC官方实现写测试
通过Spark SQL External Data Sources JDBC实现将RDD的数据写入到MySQL数据库中. jdbc.scala重要API介绍: /** * Save this RDD ...
解决IDEA Springboot项目sql文件打开提示No data sources are configured to run this SQL and provide advanced的问题
Idea2018的Springboot项目,如果里面有.sql文件,打开后,会提示"No data sources are configured to run this SQL and pr ...
警告： No data sources are configured to run this SQL and provide advanced code assistance. Disable this inspection via problem menu (Alt+Enter). more... (Ctrl+F1) SQL dialect is not configured. Postgr
python3出现问题: 警告: No data sources are configured to run this SQL and provide advanced code assistance ...
[iOS基础控件 - 6.12.3] @property属性 strong weak copy
A.概念 @property 的修饰词 strong: 强指针/强引用(iOS6及之前是retain) weak: 弱智真/弱引用(iOS6及之前是assign) 默认情况所有指针都是强指针 ...

随机推荐

[PHP] 转义字符 Escape character
\n is a symbol for new line \t is a symbol for tab and \r is for 'return'
JMeter中用java修改文件名称
import java.io.File; String NewDataPath=bsh.args[0]; File SrcFile= new File(NewDataPath+"AutoTe ...
JMeter Ant Task 生成的*.jtl打开之后request和response data是空的，怎样让其不是空的呢？
JMeter Ant Task 生成的*.jtl打开之后request和response data是空的,怎样让其不是空的呢?修改JMeter.properties,将jmeter.save.save ...
内网IP和公网IP的区别
内网IP和公网IP的区别什么是内网IP: 一些小型企业或者学校,通常都是申请一个固定的IP地址,然后通过IP共享(IP Sharing),使用整个公司或学校的机器都能够访问互联网.而 ...
AngularJS标准Web业务流程开发框架-4.AngularJS四大模块之一：Controller
一.Controller的创建 angular.controller("name",funtion($scope){ }) 1.name:控制器的名称(建议参考Java包的命名规范 ...
SPSS-比较均值-独立样本T检验案例解析
在使用SPSS进行单样本T检验时,很多人都会问,如果数据不符合正太分布,那还能够进行T检验吗?而大样本,我们一般会认为它是符合正太分布的,在鈡型图看来,正太分布,基本左右是对称的,一般具备两个参数,数 ...
Tomcat 环境变量配置
1.变量和常量 i 和 0 2.环境变量 cmd >set 查看所有环境变量 %PATH% 系统指定可执行文件的搜索路径,可以是 .exe .bat String path=“C:\WINDOW ...
event对象的clientX,offsetX,screenX,pageX和offsetTop,offsetHeight等等
先总结下区别: event.clientX.event.clientY 鼠标相对于浏览器窗口可视区域的X,Y坐标(窗口坐标),可视区域不包括工具栏和滚动条.IE事件和标准事件都定义了这2个属性 eve ...
jbpm(流程管理)
1.jbpm是什么 JBPM,全称是Java Business Process Management(业务流程管理),它是覆盖了业务流程管理.工作流.服务协作等领域的一个开源的.灵活的.易扩展的可执行 ...
PAT甲 1007. Maximum Subsequence Sum (25) 2016-09-09 22:56 41人阅读评论(0) 收藏
1007. Maximum Subsequence Sum (25) 时间限制 400 ms 内存限制 65536 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHEN, Y ...

FunDA（12）－ 示范：强类型数据源 - strong typed data sources

FunDA（12）－ 示范：强类型数据源 - strong typed data sources的更多相关文章

随机推荐

热门专题

FunDA（12）－示范：强类型数据源 - strong typed data sources

FunDA（12）－示范：强类型数据源 - strong typed data sources的更多相关文章