1.dmp-data mabagement platform数据管理平台

数据赋能,营销智变

2.定义

把分散的第一,第三方异构、多源数据进行整合,然后纳入统一技术平台中,并对这些数据进行标准化和细分处理,用户可以把细分结果推向现有的各类应用环境中。

3.功能

数据清洗

数据管理

数据挖掘

4.用途

发展自身业务

卖数据模型

给别人提供接口访问

5.dsp和dmp

dsp是为广告主服务的,优化广告投放策略

dmp在dsp基础上可以做更多事情

6.dmp数据工程步骤

目标和问题:

  • 业务流程和模型的清晰理解
  • 业务目标、问题和数据源映射方法

数据源梳理:第一、二、三方数据

  • 第一方是指自己拥有的数据
  • 第二方是指从合作伙伴来的数据
  • 第三方是指从非直接合作关系来的数据

数据源内容和质量分析:

  • 一致性
  • 实效性
  • 完整性等

数据标签的设计和定义:

  • 属性类,如性别,年龄
  • 行为类,如购买
  • 模型类,如VIP

标签体系梳理:

  • 业务口径
  • 技术口径

数据接口设计:

  • hdfs目录设计,ods和dw分层设计
  • 按数据来源进行划分
  • 数据接口定义,etl和elt(抽取,转换,加载)
  • 数据来源
  • 存放方式
  • 存放目录
  • scheme模型信息
  • 数据更新频次
  • 增量存放
  • 全量存放

数据流data stream设计:

  • 控制流和数据流

存储和服务器设计:

数据模型data scheme设计:

数据仓库模型设计:

数据处理链条和各模块设计:设计注意事项

  • 数据流设计
  • 数据处理逻辑设计
  • 中间过程表设计
  • 时间变量设计
  • 依赖关系设计

结果和质量验证设计:

可靠性 etl开发:

运维:

  • 需求变更处理
  • 调度问题处理
  • 系统故障诊断

7.DMP数据工程步骤

a.数据源梳理

  • 客户主营业务是什么
  • 支撑业务系统有哪些
  • 各系统能产生哪些数据
  • 业务系统的数据库设计及数据字典能否获取
  • 数据质量如何
  • 是否已有数据仓库系统

b.标签体系及其口径梳理

  • 需要创建哪些标签
  • 需要引入哪些日志数据
  • 标签的业务口径如何梳理
  • 标签的技术口径如何梳理

c.接口定义

  • 搬运哪些数据到DMP平台
  • 以何种频率或周期进行搬运
  • 增量还是全量搬运
  • 搬运过来后如何存放

d.数据模型设计

  • 需要定义哪些数据集
  • 数据集在HDFS上如何组织
  • 每个数据集存放哪些属性
  • 数据集中属性的命名及数据类型如何设计
  • 数据集的更新频次如何设计
  • 数据集的更新方式(增量/全量)如何设计
  • 数据集是否需要时间分区
  • ID打通如何设计

e.ETL设计

  • 设计生成每一个目标数据集的流程
  • 设计流程中每一个环节的处理逻辑
  • 设计一批中间结果数据集,供后续的若干流程使用
  • 设计时间变量控制数据处理的时间周期
  • 识别各流程之间的依赖关系

f.ETL开发

  • 编写代码(SQL,Python,Scala等)
  • 调试代码
  • 部署代码
  • 调度代码

g.运维

  • 需求变更处理
  • 调度失败问题处理
  • 数据质量问题处理
  • 项目的导入导出管理

DMP的更多相关文章

  1. Oracle 数据库导入导出 dmp文件

    转自: http://hi.baidu.com/ooofcu/blog/item/ec5d1f9580d41f007af48077.html 首先询问对方数据库的表空间名称和大小,然后在你的oracl ...

  2. ORACLE导入导出数据dmp

    imp testwms3/isc@TESTGMMC FILE=C:\ZKGL_201407012334.dmp ignore=y fromuser=GMMCZKGL touser=testwms ta ...

  3. oracle导出一条二进制数据(二进制,long只能通过dmp导出)

    exp jxfoc/JXFOC@ORCL file=d:\dd.dmp tables=(jxfoc.FLIGHT_PLAN_MAKE_LOG,jxfoc.METAR_CONTENT_FOR_MAIL) ...

  4. 使用VS2013分析DMP文件

    当一个发布的.NET应用程序出现app crash,无法通过日志分析异常原因时,就需要通过分析DMP文件了,传统方式是通过WinDbg来分析DMP文件,但是WinDbg用起来不是很方便,其实VS就是一 ...

  5. Linux 中 Oracle dmp 文件导入导出

    a. 用户名 system 密码 manager 导出到D:/daochu.dmp中 exp system/manager@SID file=d:/daochu.dmp full=y b. 将数据库中 ...

  6. DSP, SSP, DMP

    先了解下广告的产业链有哪些人群: 广告主advertisers 显然是指想为自己的品牌或者产品做广告的人,例如宝马.Intel.蒙牛-- 媒体publisers       则是提供广告位置的载体,例 ...

  7. Oracle数据库导入、导出dmp文件

    oracle导出数据: 1.该处的导出数据需要在dos命令行下执行,进入到oracle客户端路径下执行(该处也可为oracle客户端路径配置系统变量),如: E:\oraclexe\app\oracl ...

  8. oracle 11g dmp文件导入10g

    需要导表的时候死活进不去, 现在没需求了.试了一把,一点问题都没.无语.下次遇到问题解决下吧. 导入导出命令:imp abc/abc123@ORCL file='d:\脚本\new\t_adverti ...

  9. Oracle----SQL语句积累 (Oracle 导入 dmp文件)

    Oracle----SQL语句积累 (Oracle 导入 dmp文件) Oracle SQL PL  导入dum文件 1.数据库DBA权限: 注意:这个是在cmd命令行中直接输入,不需要进入Oracl ...

  10. Oracle导出表(即DMP文件)的两种方法

    转载:http://blog.csdn.net/lanpy88/article/details/7580691   方法一:利用PL/SQL Developer工具导出: 菜单栏---->Too ...

随机推荐

  1. 数论day1 —— 基础知识(们)

    [pixiv] https://www.pixiv.net/member_illust.php?mode=medium&illust_id=61632537 向大(hei)佬(e)势力学(di ...

  2. Spring项目搭建

    1,新建web项目 2,导入jar包 3,编写配置文件 <?xml version="1.0" encoding="UTF-8"?> <bea ...

  3. 在sqlserver中如何从字符串中提取数字,英文,中文,过滤重复字符

    原文:在sqlserver中如何从字符串中提取数字,英文,中文,过滤重复字符 最近做项目的时候,经常用到一个字符串中的某些字符,处理起来非常的棘手,现在用下面的方法就可以很方便的从字符串中处理你想要的 ...

  4. sourceinsight tab 空格 对齐 等宽字体

    参考:http://bbs.chinaunix.net/thread-587409-1-1.html 1. SMART TAB的用法. 解决自动缩进. 新开一个PROJECT后,点Options-&g ...

  5. kaptcha验证码

    @Action("/validimg") public String validimg() throws Exception { genernateCaptchaImage(); ...

  6. 基于物品过滤的Slope One 算法

    Slope One 算法是由 Daniel Lemire 教授在 2005 年提出的一个 Item-Based 推荐算法. 他的主要优点是简单,易于扩展.实际上有多个Slope One算法,在此主要学 ...

  7. TP5使用PHPMAILER发送邮件

    TP使用PHPMAILER发送邮件 1.申请一个SMTP服务的邮箱. 我申请的是smtp.163.com的服务,注意SMTP服务密码不是登陆密码,需要单独设置 2.下载phpmailer类库文件htt ...

  8. 关于http和https淘宝支付宝跨域解决方法研究

    关于http和http跨域淘宝解决方式研究: http://buyer.trade.taobao.com/trade/pay.htm?spm=a1z01.2.3.4.0.wZAGp9&bizO ...

  9. 软件测试技术---Web应用软件测试

    从测试的角度看,Web应用软件的以下特点会导致Web应用软件的测试有别于其他软件的测试 1.基于无连接协议 2.内容驱动 3.开发周期短 4.演化频繁 5.安全性要求较高 6.美观性要求较高 Web应 ...

  10. 甲骨文Java Archive

    甲骨文Java Archive 甲骨文Java Archive提供自助下载访问我们的一些历史的Java版本. 警告: 这些旧版本的JRE和JDK来帮助开发人员提供了在旧系统调试问题. 他们没有更新最新 ...