Falcon

1. JE

falcon还需要安装je用来处理jdbc，否则打不开falcon的页面，爆内部错误503，然后看异常信息：
Caused by: org.apache.falcon.FalconException: java.lang.RuntimeException: GraphFactory could not instantiate this Graph implementation [com.thinkaurelius.titan.core.TitanFactory].
Caused by: java.lang.RuntimeException: GraphFactory could not instantiate this Graph implementation [com.thinkaurelius.titan.core.TitanFactory].
Caused by: java.lang.reflect.InvocationTargetException
Caused by: java.lang.NoClassDefFoundError: com/sleepycat/je/LockMode
Caused by: java.lang.ClassNotFoundException: com.sleepycat.je.LockMode

处理方式：
1.wget –O je-5.0.73.jar http://search.maven.org/remotecontent?filepath=com/sleepycat/je/5.0.73/je-5.0.73.jar
2. Log in to the Ambari server with administrator privileges.
su – root
3. Copy the file to the Ambari server share folder.
cp je-5.0.73.jar /usr/share/
4. Set permissions on the file to owner=read/write, group=read, other=read.
chmod 644 /usr/share/je-5.0.73.jar
5. Configure the Ambari server to use the Berkeley DB driver.
ambari-server setup --jdbc-db=bdb --jdbc-driver=/usr/share/je-5.0.73.jar
6. Restart the Ambari server.
ambari-server restart
7. Restart the Falcon service from the Ambari UI.
You need to have administrator privileges in Ambari to restart a service.
a) In the Ambari web UI, click the Services tab and select the Falcon service in the left Services pane.
b) From the Falcon Summary page, click Service Actions > Restart All.
c) Click Confirm Restart All.
When the service is available, the Falcon status displays as Started on the Summary page.
摘自：https://community.hortonworks.com/questions/77600/faclon-web-ui-failing-with-http-503-service-unavai.html
参考：https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.4.2/bk_data_governance/content/ch_hdp_data_governance_overview.html

2. 创建相应的文件夹
sudo su falcon
hadoop fs mkdir -p /apps/falcon/{clusterName}/staging
hadoop fs mkdir -p /apps/falcon/{clusterName}/working
hadoop fs mkdir -p /apps/falcon/tmp

3. 日志路径
/var/log/falcon

在安装的时候每次都会让我配置一下hadoop以及yarn的配置，因为里面有包含home路径；尽管不是很清楚为什么不允许home目录，ambari每次还会默认添加上home目录；但是这次安装却无论如何也改不了配置，改了DataNode的路径，自动就会在改回带home的路径；后来我在hadoop的配置的config group中自定义了一个LorryGroup，并且把所有的节点拖进去，问题解决（安装falcon的时候，在配置hadoop选择LorryGroup）；为什么这次需要通过添加group的方式来安装falcon之前那次不用？这个Config Group到底是做什么用的？

4. Cluster，Feed各个实体xml属性介绍
https://falcon.apache.org/EntitySpecification.html

falcon在cluster中定义了很多数据源，数据目的地的信息，interface（接口）就是定义这些用的；这里包括很多类型。整体来讲分为两类，一类是关系型到大数据，对于关系型数据库需要在DataSource中定义；大数据HDFS的相关信息定义在cluster中，包括hive的接口，hdfs的接口等；Feed则是定义一套数据的处理流程，包括源和目的地，源和目的地分别和之前定义的Datasource和cluster绑定。

在创建数据源的时候，如果是MySQL，在指定Driver jar的时候路径是HDFS路径（直接写路径）：例如/tools/mysql-connector-java.jar；另外还要保证这个文件falcon用户是有访问权限的。

5. 后续调研

https://oozie.apache.org/docs/4.0.0/DG_HCatalogIntegration.html

https://oozie.apache.org/docs/4.0.0/AG_Install.html#HCatalog_Configuration

https://oozie.apache.org/docs/4.0.0/DG_JMSNotifications.html

可以通过JMS实现数据传输；这个还是可以研究一下；是否可以形成一套数据导入的机制

Falcon的更多相关文章

Hive SQL 监控系统 - Hive Falcon
1.概述在开发工作当中,提交 Hadoop 任务,任务的运行详情,这是我们所关心的,当业务并不复杂的时候,我们可以使用 Hadoop 提供的命令工具去管理 YARN 中的任务.在编写 Hive SQ ...
open falcon dashboard 安装
open falcon dashboard 安装 yum -y install lrzsz python-virtualenv mysql-devel python-devel libffi-deve ...
Falcon Genome Assembly Tool Kit Manual
Falcon Falcon: a set of tools for fast aligning long reads for consensus and assembly The Falcon too ...
Falcon：三代reads比对组装工具箱
主页:github: PacificBiosciences/FALCON 简介 Falcon是一组通过快速比对长reads,从而来consensus和组装的工具. Falcon工具包是一组简单的代码集 ...
falcon常用参数解析
CPU.xxx cpu.idle cpu.idle表示除硬盘IO等待时间以外其它等待时间,这个值越大,表示cpu越空闲,还可以执行更多的任务,反之亦然,此处我们falcon展示的是idle的波动情况, ...
Linux记录-JMX监控Tomcat上传到falcon
1.登录测试服务器xxxxxx xxxxxx su root输入xxxx 2.先修改Tomcat的启动脚本,(linux下为catalina.sh),添加以下内容: CATALINA_OPTS=&qu ...
falcon nodata 小坑一枚
按照官方文档配置完一切正常,唯独 nodata, 明明有正常的数据,但是为什么 nodata 会认为是没收到呢困扰许久,直到看了数据库中的数据才恍然大悟 falcon_portal库中的 hosts ...
centos安装 Falcon+
1:环境准备 : 安装 go环境 :下载 - Golang中国参照 :http://www.cnblogs.com/Amos-Turing/p/8494250.html 安装 mysql 安装 r ...
论文阅读 | Falcon: Balancing Interactive Latency and Resolution Sensitivity for Scalable Linked Visualizations
作者: Dominik Moritz, Bill Howe, Jeffrey Heer 发表于CHI 2019, 三位作者都来自于University of Washington Interactiv ...

随机推荐

fastdfs 集群配置
fastdfs 简介FastDFS是一个国产开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储.文件同步.文件访问(文件上传.文件下载)等,解决了大容量存储和负载均衡的问题.特别适合以文 ...
Day10 - Python异步IO、Pymysql、paramiko、
IO多路复用: 参考博客:http://www.cnblogs.com/wupeiqi/p/6536518.html socket客户端(爬虫): http://www.cnblogs.com/w ...
【网络编程】inet_addr、inet_ntoa、inet_aton、inet_ntop和inet_pton区分
先上一张图 1.把ip地址转化为用于网络传输的二进制数值 int inet_aton(const char *cp, struct in_addr *inp); inet_aton() 转换网络主机地 ...
CentOS 6安装Oracle 11gR2数据库
1.安装环境--- 操作系统:CentOS release 6.8 (Final) oracle:Oracle Database 11g Enterprise Edition Release 11.2 ...
随机生成验证码及python中的事务
1.随机生成验证码 # import random # print(random.random()) #-1的小数 # print(random.randint(,)) #包括1和3 # print( ...
HP数组转JSON函数json_encode和JSON转数组json_decode函数的使用方法
这两个函数比较简单,我这里直接写例子,但是有一点一定要注意,json数据只支持utf-8格式,GBK格式的数据转换为json会报错! json_encode()用法: <?php$data =a ...
Python模块化
在Python中,一个.py文件就称之为一个模块(Module). 模块化的好处: 1.大大提高了代码的可维护性. 2.编写代码不必从零开始.当一个模块编写完毕,就可以被其他地方引用.我们在编写程序的 ...
C++11_ Variadic Templates
版权声明:本文为博主原创文章,未经博主允许不得转载. 这次主要介绍C++11的又一个新特性 Variadic Templates (可变模板参数) 它的实现类似于initializer_list< ...
[Shell]bash的良好编码实践
最好的bash脚本不仅可以工作,而且以易于理解和修改的方式编写.很多好的编码实践都是来自使用一致的变量名称和一致的编码风格.验证用户提供的参数是否正确,并检查命令是否能成功运行,以及长时间运行是否能保 ...
[置顶] 普通程序员如何入门AI
毫无疑问,人工智能是目前整个互联网领域最火的行业,随着AlphaGo战胜世界围棋冠军,以及各种无人驾驶.智能家居项目的布道,人们已经意识到了AI就是下一个风口.当然,程序员是我见过对于新技术最敏感的一 ...

Falcon

Falcon的更多相关文章

随机推荐

热门专题