@ 目录 概述 定义 发展历史 发行版本 优势 生态项目 架构 组成模块 HDFS架构 YARN架构 部署 部署规划 前置条件 部署步骤 下载文件(三台都执行) 创建目录(三台都执行) 配置环境变量(三台都执行) 安装和配置(hadoop1上执行) 启动和停止Hadoop HDFS环境测试 计算和资源环境测试 概述 定义 Hadoop 官网地址 https://hadoop.apache.org/ Hadoop GitHub地址 https://github.com/apache/hadoop…
 对于SQL的Join,在学习起来可能是比较乱的.我们知道,SQL的Join语法有很多inner的,有outer的,有left的,有时候,对于Select出来的结果集是什么样子有点不是很清楚.Coding Horror上有一篇文章,通过文氏图 Venn diagrams 解释了SQL的Join.我觉得清楚易懂,转过来.     假设我们有两张表.Table A 是左边的表.Table B 是右边的表.其各有四条记录,其中有两条记录name是相同的,如下所示:让我们看看不同JOIN的不同. Spa…
         还需要注册的是我们还有一个是"交差集" cross join, 这种Join没有办法用文式图表示,因为其就是把表A和表B的数据进行一个N*M的组合,即笛卡尔积.表达式如下:      SELECT * FROM TableA CROSS JOIN TableB  x 4 = 16 条记录,一般来说,我们很少用到这个语法.但是我们得小心,如果不是使用嵌套的select语句,一般系统都会产生笛卡尔乘积然再做过滤.这是对于性能来说是非常危险的,尤其是表很大的时候.    …
基于word2vec的文档向量模型的应用 word2vec的原理以及训练过程具体细节就不介绍了,推荐两篇文档:<word2vec parameter learning explained>.和<word2vec中的数学>. 在<word2vec中的数学>中谈到了训练语言模型的一些方法:比如n-gram和神经网络.在使用神经网络训练语言模型时得到的"副产物",就是word2vec词向量.基于神经网络训练语言模型有2种方案:cbow和skip-gram,…
目录 一.工具使用 语言使用:MarkDown 简介 使用原因 使用方法 软件使用:Typora 简介 环境设置搭建 1)搭建图床 2)配置PicGo 3)配置typora 4)测试 图片上传测试 平台兼容测试 BUG消除 Failed to fetch "success":false 一.工具使用 语言使用:MarkDown 简介 Markdown是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的XHTML(或者HTML)文档. 由于Markdown的…
文心大模型api使用 首先,我们要获取硅谷社区的连个key 复制两个api备用 获取Access Token 获取access_token示例代码 之后就会输出 作文创作 作文创作:作文创作接口基于文心ERNIE 3.0 Zeus大模型,用户按规定的prompt模板输入上文,接口自动生成不同长度的下文. 接口要求 接口调用流程 请求参数 参数 返回参数 错误代码 任务模板 shell python go 首先,我们要获取硅谷社区的连个key 复制两个api备用 获取Access Token 请求…
LSA latent semantic analysis 映射词-文档到一个低维隐语义空间 比较词和文档在低纬空间的相似性 topic 是 Vocab 上的概率分布(符合多项式分布) 文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型 plsa 模型 LDA模型 大规模LDA系统 spark LDA Google PLDA 微软LightLDA 腾讯LDA,PEACOCK…
[标签名称] arclistsg [标签简介] 单表独立模型的文档列表调用标记 [功能说明] 用于调用单表模型的内容,在V5.3系统以上版本中加入了单表模型的概念,脱离了以前的主从表的数据表关联结构,一般我们在添加内容模型的时候会选择是否为单表模型还是主从表模型.我们可以进入系统后台[核心]-[内容模型管理],查看系统现有的内容模型,在系统默认环境下,只有分类信息是单表模型,一般添加单表模型,模型的id号都小于-1,即分类信息模型id号为-8. [适用范围] 全局使用 [参数说明] col='1…
1. http请求和响应步骤 在讲解OkHttp之前, 我们首先来个高清大图, 看下http请求的整个步骤, 有个整体概念.  2. http每一步详细内容 在一次完整的HTTP通信过程中, Web浏览器与Web服务器之间将完成下列7个步骤: 2.1 建立TCP连接 在HTTP工作开始之前, Web浏览器首先要通过网络与Web服务器建立连接, 该连接是通过TCP来完成的, 该协议与IP协议共同构建Internet, 即著名的TCP/IP协议族, 因此Internet又被称作是TCP/IP网络. …
张文升认为,PG无论在可靠性和性能方面都不输其它任何关系型数据库   张文升,探探DBA,负责探探的数据库架构.运维和调优的工作.拥有8年开发经验,曾任去哪儿网DBA.   9月24日,张文升将参加在北京举办的线下活动,分享PostgreSQL在互联网应用的一些经验.值此,他分享了个人的一些经历,以及对PG的一些看法.   想和这些大咖面对面聊PG吗?点击这里>>>免费报名   正文:   初接触PG,“What?什么是PG?”一脸懵圈——张文升用时下比较流行的一个词儿形容当时的心情,而…