Carrot2 in action 初步印象】的更多相关文章

RawCluster:聚类中的类别单位 RawCluster.getDocuments():获得该类的文档列表 RawDocument:每个类的文档单位 STC:后缀树表示法 2008-11-13 Carrot2的组建(components)的介绍: 1.        输入(input):产生聚类文本的组建.Carrot2针对目前的几个主要搜索引擎(Yahoo:carrot2-input-yahooapi.jar, Google, MSN Search)和开源搜索引擎(lucene:carro…
python webdriver自动化测试初步印象 以下示例演示启动firefox,浏览google.com,搜索Cheese,等待搜索结果,然后打印出搜索结果页的标题 from selenium import webdriver from selenium.common.exceptions import TimeoutException from selenium.webdriver.support.ui import WebDriverWait # available since 2.4.…
HBASE概念: HBASE是一个分布式架构的数据库,通过对数据进行多层的分块打散储存.从而改写传统数据库的储存能力和读取速度. HBASE的集群服务器: HBASE的集群主要分为Zookeeper集群,Master集群,RegionSever集群. Zookeeper集群:储存Table的Region地址,管理Master和RegionSever服务器间的操作. Master集群:进行建表,删表工作和分配Region(管理负载均衡,Split时,重新分配Region) RegionSever集…
1.连接服务器数据库,以Navicat连接mysql为例 1.1 常规 新建连接,连接名,主机名或ip地址:127.0.0.1 端口:3306用户名:(服务器端)root密码:(服务器端)pwd 1.2 SSH使用SSH通道主机名或IP地址:(服务器IP)端口:22用户名:(服务器用户名root)密码:(服务器密码)连接成功之后,像本地操作数据库一样. 2.安装sshsecureshellclient_3_2_9软件 3.使用SSH Secure Shell Client登录,Quick Con…
从其官网整理了一些资料如下: 1.基本概念 基本使用概念 PaddlePaddle是源于百度的一个深度学习平台.PaddlePaddle为深度学习研究人员提供了丰富的API,可以轻松地完成神经网络配置,模型训练等任务. 这里将介绍PaddlePaddle的基本使用概念,并且展示了如何利用PaddlePaddle来解决一个经典的线性回归问题. 2.安装 PaddlePaddle的编译选项 PaddlePaddle的编译选项,包括生成CPU/GPU二进制文件.链接何种BLAS库等.用户可在调用cma…
转自:<你所不知的OSG>第一章:CMake初步(1)http://bbs.osgchina.org/forum.php?mod=viewthread&tid=1189&fromuid=3434 本章的主要目的并非介绍OpenSceneGraph的常用类和功能,而是介绍它的一个重要伙伴,抑或说,是一个被愈来愈多的开源软件所青睐的强劲的辅助开发工具——CMake. CMake的定义是:一个跨平台.开源.可扩展的软件编译生成系统,如果您熟悉与之同类的QMake(开源开发库Qt的自动…
作为开源数据库的新手,近日有兴对比了Pg和MySQL的查询计划. 通过Pg源码目录下的src\backend\executor\README文件,加上一些简单调试,就能对Pg的执行机制产生一个初步印象:而MySQL的代码可读性比Pg差了不少,可能还要花些时日去了解先. 原本想写一篇执行机制对比的文章,现在只能谈谈对Pg的体会,不足和错误之处敬请指正. Pg算是学院派的开源数据库代表产品,其基于关系代数的优化.操作符的实现看起来十分亲切.相较于MySQL扁平的计划,Pg的执行计划让人一目了然. P…
开篇引言 说起ASP.NET MVC,我想作为WebForms开发者第一点要问的是:为什么要使用它?我的理解是:MVC是更细节化的框架,“细节可控”意味着你的系统更精致.具体体现在应用上.MVC的出现,可能正是迎合Web开发越来越精致的需求.就我了解的一个大型投资管理电商平台,所用的架构就是ASP.NET MVC.MVC将来在系统应用的趋势,很可能就是大型电子商务平台.当然,WebForms并不是被“抛弃”,在快速开发,控件复用上,WebForms依然走在前面.有时候,根据需要,我们可以在同一项…
本期内容 : spark streaming另类在线实验 瞬间理解spark streaming本质 一.  我们最开始将从Spark Streaming入手 为何从Spark Streaming切入Spark定制?Spark的子框架已有若干,为何选择Spark Streaming?让我们细细道来. 1.  Spark最开始只有Spark Core,没有目前的这些子框架.这些子框架是构建于Spark Core之上的.没有哪个子框架能摆脱Spark Core.我们通过对一个框架的彻底研究,肯定可以…
1. 什么是持续集成 持续集成 (Continuous Integration, 简称 CI) 是软件工程中的一种实践, 用于将开发人员不同阶段的工作成果集成起来, 通常一天之中会进行多次. 持续集成最初在 极限编程 (Extreme Programming) 中提出, 主要用于执行自动化测试. 目前持续集成的概念已经逐渐独立出来, 并扩展为 构建服务器 (Build Server), 质量控制 (Quality Control) 和 持续交付 (Continuous Delivery) 等多种…
Is rails slow? 「铁路非常慢」,你或许听过这个笑话,那么我们的 Rails 框架呢? 假设说 Rails 慢,那么怎样提升 Rails APP 的性能就成了开发人员们最关注的问题. 或许你听说过非常多提升 RoR APP 性能的方法,它们有难有易.我们须要在选择其中最能帮助开发人员脱离性能困境的. 这里列举了几种不同的提升 Rails 应用性能的方法. 1. 数据库索引 你的 APP 被 DB 性能限制,优秀的数据库索引能够在大型数据库表中带给你100倍的性能提升. 然而并不是全部…
本文讲述extjs mvc的Helloworld,tabPanel,event,页面布局layout等内容. 本页包含:MVC模式案例(一)~MVC模式案例(六),从搭建extjs mvc到点击按钮生成tab页,事件点击 本文代码位置:http://download.csdn.net/download/xiaoliu123586/10156915 代码使用idea打开即可,如果在windows下直接用浏览器打开index.html,加载data.json树文件会找不到,必须在某服务器里打开或者或…
从今天起,我们踏上了新的Spark学习旅途.我们的目标是要像Spark官方机构那样有能力去定制Spark. 一.  我们最开始将从Spark Streaming入手. 为何从Spark Streaming切入Spark定制?Spark的子框架已有若干,为何选择Spark Streaming?让我们细细道来. 1.  Spark最开始只有Spark Core,没有目前的这些子框架.这些子框架是构建于Spark Core之上的.没有哪个子框架能摆脱Spark Core.我们通过对一个框架的彻底研究,…
1 Spark源码定制选择从Spark Streaming入手  我们从第一课就选择Spark子框架中的SparkStreaming. 那么,我们为什么要选择从SparkStreaming入手开始我们的Spark源码版本定制之路? 有下面几个方面的理由: 1)Spark大背景 Spark 最开始没有我们今天看到的Spark Streaming.GraphX.Machine Learning.Spark SQL和Spark R等相关子框架内容,最开始就只有很原始的Spark Core.我们要做Sp…
http://www.jianshu.com/p/ce791bef66bb   PlayMaker是什么? PlayMaker是Unity3D的一款 可视化 的 有限元状态机(Finite-state machine,简称Fsm) 插件,用来进行交互设计. 有限状态机(英语:Finite-state machine,缩写:Fsm)又称有限状态自动机,简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型. 我个人对Fsm的理解是这样的: Fsm将对象的复杂行为特征归纳为有限个…
struts2的验证分为分编程式验证.声明式验证.注解式验证.因现在的人越来越懒,都追求零配置,所以本文介绍下注解式验证. 一.hello world 参考javaeye的这篇文章,按着做一次,起码有个初步印象 http://www.javaeye.com/wiki/taojintianxiastruts2/1650-17-7-note-the-use-of-struts2-validation Validation使用名字叫做validator的Intercepter,在默认情况下,strut…
原文链接 这篇文章是个人知识总结相关的第一篇文章,主要目的是为了阐述我们为什么需要一个 PKM 系统,并且简单对自己这几年亲身形成的PKM 系统进行总结. PKM 是什么? PKM 是 Personal Knowledge Management 的缩写,我们先来看一下 Wikipedia 中的描述: Personal knowledge management (PKM) is a process of collecting information that a person uses to ga…
第二十章 论公司文化如果是在20世纪90年代初期,当一个人看见或者听到“IBM”时,他会联想到什么呢?或许是“大计算机”.“个人电脑”或者“ThinkPads”.但是,他们同时也必然会想到“大公司”.“保守”.“严格的管理”.“可靠”以及“黑色正装和白色衬衫”.有趣的是,后面的这些联想并不是指IBM的产品或服务,而是指公司的员工和公司的文化.IBM或许在这一方面是独一无二的,那就是,公司的文化和公司所制造和销售的产品一样的出名.即便是今天,如果你听到或者一想到“IBM”,你也会很快地联想到IBM…
前言 接上文:(阅读本文前,建议阅读前两篇文章先) 浅谈Hybrid技术的设计与实现 浅谈Hybrid技术的设计与实现第二弹 根据之前的介绍,大家对前端与Native的交互应该有一些简单的认识了,很多朋友就会觉得这个交互很简单嘛,其实并不难嘛,事实上单从Native与前端的交互来说就那点东西,真心没有太多可说的,但要真正做一个完整的Hybrid项目却不容易,要考虑的东西就比较多了,单从这个交互协议就有: ① URL Schema ② JavaScriptCore 两种,到底选择哪种方式,每种方式…
1,简介 毕业答辩搞定,总算可以闲一段时间,把这段求职经历写出来,也作为之前三个半月的求职的回顾. 首先说说我拿到的offer情况: 微软,3面->终面,搞定 百度,3面->终面,口头offer 搜狗,2面,悲剧 腾讯,1面,悲剧 布丁移动,3面,搞定 涂鸦游戏,3面,搞定 友盟,3面->CEO面,搞定 雅虎,4面->终面,搞定 微策略,2面,悲剧 人民搜索,3面->终面,搞定 人人,2面+终面+Special面,搞定 Google,7面,搞定 求职经历分为定位.准备.简历.…
当我们搭建完环境,创建应用程序和网站集后,就已经正式开启了我们的SharePoint之旅了,进入网站以后,开始基本的使用.设置,了解SharePoint相关特性,下面,来简单了解下SharePoint吧. : (图1 SharePoint 发布站点首页) 是共享本网站,12是关注此网站,12右边的是最大化内容(也就是编号5). 看图比较乱,上面的东西几乎都是可以在SharePoint网站设置里进行设置的,比如网站图标.页面名称.导航等:而新闻源.SkyDrive.网站是需要开启我的站点功能,才可…
Backbone简介 中文API:http://www.csser.com/tools/backbone/backbone.js.html 英文API:http://backbonejs.org/ Backbone是构建javascript应用程序的一个优秀的类库.他简洁.轻量级.功能实在. backbone采用MVC模式,本身提供了模型.控制器和视图从而我们应用程序的骨架便形成. backbone依赖于underscore,他是一个类库,提供了60多个函数处理数组操作.函数绑定,以及javas…
很久没有写博客了,一些读者也经常问问一些问题,不过最近我确实也很忙,除了处理日常工作外,平常主要的时间也花在了继续研究微软的实体框架(EntityFramework)方面了.这个实体框架加入了很多特性(例如LINQ等),目前也已经应用的比较成熟了,之所以一直没有整理成一个符合自己开发模式的实体框架,是因为这个框架和原来我的基于EnterpriseLibrary的模式还是有很大的不同,不过实体框架推出来也很久了,目前也去到了EntityFramework6了,听说7也快出来了. 随着我自己参考阅读…
前言 之前我做过一个web app(原来可以这么叫啦),在一个页面上有很多小窗口,每个小窗口都是独立的应用,比如: ① 我们一个小窗口数据来源是腾讯微博,需要形成腾讯微博app小窗口 ② 我们一个小窗口数据来源新浪微博,需要形成新浪微博的小窗口 我们注意到以上2个的数据源与处理方式较一致,但是需要做处理,而且其鉴权也不尽相同,所以这个js代码有相同的,也有不相同的. ③ 我们的一个小窗口数据来源于百度RSS,需要形成点击标题展开的功能 ④ 我们一个小窗口数据来源于XXX,其表现形式为选项卡...…
本文将对Ceph的基本情况进行概要介绍,以期读者能够在不涉及技术细节的情况下对Ceph建立一个初步印象. 1. 什么是Ceph? Ceph的官方网站Ceph.com上用如下这句话简明扼要地定义了Ceph: "Ceph is a unified, distributed storage system designed for excellent performance, reliability and scalability." 也即,Ceph是一种为优秀的性能.可靠性和可扩展性而设计的…
xcode 中调用API帮助 1.查看简单信息,选中后 按键 control +左键单击  或者按 右侧属性栏 里的帮助按钮 2.完整API,选中后 按键 control +左键双击 3.查看类.函数等的注释,参数列表等,alt +左键单击 4.代码块注释与取消注释的快捷键 都是 command + / 5.---不能用try...catch,但可用assertion 调试,有多个重载版本,assert(useDate<=0,"不符合则报错") swift2.0中已引入do-ca…
(转)http://www.cnblogs.com/yexiaochai/archive/2013/07/27/3219402.html 初探Backbone 前言 Backbone简介 模型 模型和属性 集合 控制集合内部顺序 视图 渲染视图 委托事件 绑定和上下文 控制器 服务器同步 填充集合 自定义行为 简单实战-官方版 简单总结 简单实战-demo 结语 补充 [原创]Backbone源码分析-Backbone架构+流程图 前言 终于到周末了,几经转折老夫工作终于落实,干起了移动前端,于…
作者:王选易,出处:http://www.cnblogs.com/neverdie/  欢迎转载,也请保留这段声明.如果你喜欢这篇文章,请点推荐.谢谢! Unity3D重要模块的类图 最近刚刚完成了一个我个人比较满意的小项目:[深入Cocos2d-x]使用MVC架构搭建游戏Four,在这个游戏中,我使用了自己搭建的MVC架构来制作一个游戏,做到了比较好的SoC(关注点分离).但是苦于Cocos2d-x没有一个比较完善的编辑器,所以我开始学习另一个非常流行的游戏引擎-Unity3D. Unity3…
1.概述: 学习一门学问的第一步就是要了解这门学问到底是什么,它可以被用来干什么. 本文罗列了学习machine learning的过程中看到的一些写得比较好的文章以及读完这些文章之后对机器学习的初步印象.希望可以帮助读者建立起ML的初步认知. 2.关于ML的优秀文章(了解什么是机器学习,机器学习可以用来干什么) 1.有趣的机器学习: 3.机器学习从入门到精通       免费课程: 1.机器学习-斯坦福大学- Andrew Ng  2. 4.学习心得 4.1什么是机器学习(ML) Arthur…
早两天看了知乎日报的这篇文章<什么是程序员的核心竞争力?>,caoz讲的几点是让我感同身受.这让我联想起了给程序猿的面试,其实也就是通过短暂的接触来发掘程序猿的核心竞争力.接下来我就谈谈我是怎么给程序猿面试的,当然每个公司每个面试官都有自己一套方法,如果觉得我说的有什么不好的,欢迎在评论中跟我讨论. 简历中的核心竞争力 简历是让面试官对你有一个初步印象的介质,每个面试者都应该花点时间研究如何让自己的简历成为一块敲门的金砖. 要方便招聘网站检索 现在大部分人求职都是通过招聘网站,除非是内推这种形…