一、数据资产目录建设

依据卫生部信息化工作领导小组办公室卫生部统计信息中心2011年3月发布的《基于电子病历的医院信息平台建设技术解决方案——业务部分》。

临床服务域

包含12个二级类目:患者标识、患者服务、入出转、医嘱、病历文书、护理文书、检验、检查、手术麻醉、治疗、输血、健康体检,业务子域共计26个。

医院管理域

包含4个二级类目:医疗管理、人力资源管理、财务管理、物资及后勤服务管理。共有业务子域共26个。

平台应用域

包含5个二级类目:区域医疗协同、管理决策、临床决策、公共卫生信息上报、患者公众服务。共有业务子域20个。

梳理建设以业务活动为核心的数据资产目录,如图一:

            图一:以业务活动为核心的数据资产目录

二、数据中心建设

根据业务活动创建主题,如图二:

图三:业务活动主题

梳理数据元标识符,保证每一个数据元的标识符具有唯一性(基本数据集:城乡居民健康档案、疾病管理、医疗服务、电子病历等)

1、数据元标识符“DE08.10.052.00”来源依据《TCHIA 7.3-2018 高血压专科电子病历数据集 第3部分:高血压门(急)诊处方》,如图三:

图三:TCHIA 7.3-2018 高血压专科电子病历数据集 第3部分:高血压门(急)诊处方

2、数据允许值“WS218--2002”来源依据《WS 218-2002 卫生机构(组织)分类与代码》,如图四:

图四:WS 218-2002 卫生机构(组织)分类与代码

关联映射业务系统表字段,并创建调度任务,如图五。

图五:创建映射关系,并加入调度任务

映射多表情况下,需要选择关联表主外键字段,如图六:

图六:主外键关系

调度任务可支持针对单表、全表,历史数据抽取,实时数据监听抽取俩种模式,如果图七:

图七:调度任务

三、数据质量质控

具有对数据质量进行评估的完整的指标体系。至少应该有完整性(事件、表单、记录、表项),一致性(主数据一致性、逻辑一致性),唯一性(无二义冗余、指标及计算口径),及时性,原始性,可溯源性及可测量性。

四、数据中台建设

根据数据资产目录快速定位业务主题,如图八:

图八:根据目录快速定位业务表

根据不同业务场景,自定义勾选数据元名称,自动生成API或新的主题库(数据集市)

五、技术架构参考

数据仓库

主要步骤包括:⑴ 命名实体识别,即在文本中找到关键词,并能与文中所指的概念对应起来。如在某一文本中,不仅能通过基因符号识别出这个基因,也可以通过同义词,或以往名称识别出该基因。⑵ 信息抽取,基于语言结构的先验知识(如自然语言中的主、谓、宾三元结构),通过自然语言处理方法,抽取出特定的动词或名词。⑶ 信息存储,将抽取到的信息(数据)加载并转存到标准化数据模型中,形成以患者为中心、医院临床信息系统(HIS、EMR、LIS、PACS等)无缝、连续和可互操作的集中式医疗大数据平台。该过程中的数据抽取、转化、加载称之为数据仓库(extract-transform-load, ETL)技术。

构建综合诊治知识库

精准治疗绝不是某一阶段的精准,应贯穿治疗全过程,即治疗前需要精准诊断,然后精准治疗,治疗失败后还需要再精准诊断和再精准治疗,直至治疗结束。

机器学习与应用

获取并控制到海量且有效的医疗大数据后,运用不同的机器学习算法,对规范化治疗中出现的“耐药性”病例进行再分析,从构建好的知识库中进行“学习”并存储,为下一步的临床治疗(包括药物、手术、放/化疗和生物治疗)实施提供精确的支持与指导。

大数据技术

基于Hadoop大数据平台搭建全文检索引擎,实现海量结构、非结构化数据的高效存储和检索,提供更快、更优用户体验。

安全管理

医疗大数据的隐私保护主要依赖于传统数据隐私保护的密码学技术。通过建立数据的分级制度,对于不同级别的信息采用不同的保护措施,并设定访问权限的控制。

医院信息集成平台(ESB)数据集成建设方案的更多相关文章

  1. 转:集成平台 jira 的使用与方案

    http://wiki.csdn.net/pages/viewpage.action?pageId=1868089 作者:Martin Seibert SEIBERT MEDIA 首席执行官. 原文地 ...

  2. 智慧文旅IOC大数据可视化建设方案

    一.建设背景 自2020年以来,疫情对各行各业的都造成了不同程度的影响,对依赖人口消费实现商业价值的文旅行业更是受到了更大的冲击,因此在疫情当下以及科技发达的今天,如何利用科技的手段赋能文旅行业进行数 ...

  3. 打造实时数据集成平台——DataPipeline基于Kafka Connect的应用实践

    导读:传统ETL方案让企业难以承受数据集成之重,基于Kafka Connect构建的新型实时数据集成平台被寄予厚望. 在4月21日的Kafka Beijing Meetup第四场活动上,DataPip ...

  4. AEAI BPM流程集成平台V3.0.2版本开源发布

    本次开源发布的是AEAI BPMV3.0.2版流程平台,该版本是数通畅联首次正式对外发布的版本,产品现已开源并上传至开源社区http://www.oschina.net/p/aeai-bpm. 产品说 ...

  5. 字节跳动流式数据集成基于Flink Checkpoint两阶段提交的实践和优化

    背景 字节跳动开发套件数据集成团队(DTS ,Data Transmission Service)在字节跳动内基于 Flink 实现了流批一体的数据集成服务.其中一个典型场景是 Kafka/ByteM ...

  6. Oracle 数据集成的实际解决方案

    就针对市场与企业的发展的需求,Oracle公司提供了一个相对统一的关于企业级的实时数据解决方案,即Oracle数据集成的解决方案.以下的文章主要是对其解决方案的具体描述,望你会有所收获. Oracle ...

  7. 数字化转型——医院数字化管理平台HDMP建设历程

    ​ 最近几年一直在做医疗行业的B端应用,在搭建医院数字化转型管理平台的过程中累积了一些知识,准备抽时间不断的把整个平台搭建过程及思想记录下来,帮助自己记忆,也希望对相应知识点有需要的伙伴能有一个启发. ...

  8. 医院信息集成平台(ESB)实施、建设方案

    医院信息集成平台(ESB)实施.建设方案 基于中立.标准.开放的IT架构和数据标准,打造插拔式医院应用生态. 解决方案 基于ESB集成总线,构建医院信息化建设顶层设计.                 ...

  9. 医院大数据平台建设_构建医院智能BI平台的关键技术

    在新技术层出不穷的当下,世界各地的组织正在以闪电般的速度变化和进化,以便在新技术可用时加以利用.其中目前最具活力的一个领域是商业智能(BI).想一想,你可能已经习惯以每周或每月IT或数据科学家交付给你 ...

随机推荐

  1. day 36 初始前端 html语言

    参考博客https://www.cnblogs.com/majj/p/9056951.html进行学习 html标签 特征: .空白折叠现象 .对空格和换行不敏感 .标签要严格封闭 p标签的嵌套 多注 ...

  2. 聚类-K-Means

    1.什么是K-Means? K均值算法聚类 关键词:K个种子,均值聚类的概念:一种无监督的学习,事先不知道类别,自动将相似的对象归到同一个簇中 K-Means算法是一种聚类分析(cluster ana ...

  3. Celery框架实现异步执行任务

    Celery 官方 Celery 官网:http://www.celeryproject.org/ Celery 官方文档英文版:http://docs.celeryproject.org/en/la ...

  4. SpringBoot+Vue+WebSocket 实现在线聊天

    一.前言 本文将基于 SpringBoot + Vue + WebSocket 实现一个简单的在线聊天功能 页面如下: 在线体验地址:http://www.zhengqingya.com:8101 二 ...

  5. 配置防盗链、访问控制Directory和FilesMatch

    5月31日任务 课程内容: 11.25 配置防盗链11.26 访问控制Directory11.27 访问控制FilesMatch扩展几种限制ip的方法 http://ask.apelearn.com/ ...

  6. JVM虚拟机详解+Tomcat性能优化

    1.JVM(java virtual mechinal) ()JVM有完善的硬件架构,如处理器.堆栈.寄存器当,还具有相应的指令系统. ()JVM的主要工作时解释自己的指令集(即字节码),并映射到本地 ...

  7. 2019-2020-1 20199304《Linux内核原理与分析》第一周作业

    通过对Linux基础课程的学习,我对Linux的背景以及和Windows的区别有了了解, Linux 平台:大都为开源自由软件,用户可以修改定制和再发布,由于基本免费没有资金支持,部分软件质量和体验欠 ...

  8. pikachu 暴力破解

    一 暴力破解 1.基于表单的暴力破解 先随意测试root/root登录,用Burp抓包,丢进Intruder 添加username和password两个参数变量,攻击类型选择Clusterbomb 有 ...

  9. 图解leetcode —— 395. 至少有K个重复字符的最长子串

    前言: 每道题附带动态示意图,提供java.python两种语言答案,力求提供leetcode最优解. 描述: 找到给定字符串(由小写字符组成)中的最长子串 T , 要求 T 中的每一字符出现次数都不 ...

  10. 华为eNSP路由交换-静态路由

    静态路由 一. 静态路由及默认路由基本配置 1.1实验内容 在由三台路由器所组成的简单网络中,R1和R3各连着一台PC,现在要求能够实现PC-1和PC-2之间的通信.本实验将通过配置基本的静态路由和默 ...