为什么学

《What I wish I knew When I was 20》这本书给了我很多启发。作者在书中提到,Stanford 大学培养人才的目标是 ”T形人才“:精通某个领域,但对各个领域都有所涉猎。字母 “T“ 的一竖代表深度,一横代表宽度。具有T型的知识结构是成为企业家的基础。我不禁问自己:我的深度在哪里?宽度在哪里?

作为电子系出身的软件开发者,这一年来我在业余时间也学习了不少东西:

  • 前端开发方面:JS 的几个部分: DOM 和 事件机制, CSS 的几个部分:Box Model, Visual Model
  • 后端方面:较为系统地学习了数据库的基础知识 :ER模型、关系代数和关系演算、索引、查询的基本过程

当然在工作中也学习了很多的东西:

  • 应用软件开发的各个方面:网络、数据库、加密
  • 异步的事件机制 (libevent, gevent)
  • WEB 后端开发:Django
  • Android 开发

一一列举出来,林林总总也不少了,或者”T”型中的那一横已经有点眉目了。但是那一竖呢?深度在哪里?

学什么

同样是上面那本 《What I wish I knew When I was 20》 书中提到,对于个人来说最幸福的职业在于 “兴趣、能力、市场的统一“。

由于工作需要,前段时间用到了 基于 LuceneElasticsearch。经过思考,我发现信息检索(Information Retrival) 对我而言是一个不错的选择。

  1. 兴趣:工作中我觉得这部分内容还是挺吸引我的
  2. 能力:有待检验,不过我自信还是有把这个领域掌握好的
  3. 市场:这个更不用说了。哪个网站、软件、APP 上方没一个搜索框?

因此,我决定深入地学习信息检索领域的知识。具体的来讲,要学的包括:

  • 基础知识
  • 具体应用
  • 系统设计

怎么学

  • 基础知识主要读 《Introduction to Information Retrival》这本书
  • 具体应用主要学习 Lucene 这个库
  • 系统设计主要学习 ElasticSearch 这个项目

当然这三点不一定非要有严格的先后顺序。

Lucene/ElasticSearch 学习系列 (1) 为什么学,学什么,怎么学的更多相关文章

  1. Lucene/ElasticSearch 学习系列 (2) Information Retrival 初步之名词解释

    计算机领域一半是理论,一半是在理论基础之上的应用.要想深入地掌握某个方面的应用,就需要先学习那方面的理论. “搜索”是应用,其背后的理论是 "Information Retrieval&qu ...

  2. Elasticsearch学习系列一(部署和配置IK分词器)

    Elasticsearch简介 Elasticsearch是什么? Elaticsearch简称为ES,是一个开源的可扩展的分布式的全文检索引擎,它可以近乎实时的存储.检索数据.本身扩展性很好,可扩展 ...

  3. Elasticsearch学习系列七(Es分布式集群)

    核心概念 集群(Cluster) 一个Es集群由多个节点(Node)组成,每个集群都有一个共同的集群名称作为标识 节点(Node) 一个Es实例就是一个Node.Es的配置文件中可以通过node.ma ...

  4. Elasticsearch学习系列之term和match查询

    lasticsearch查询模式 一种是像传递URL参数一样去传递查询语句,被称为简单查询 GET /library/books/_search //查询index为library,type为book ...

  5. Elasticsearch学习系列之term和match查询实例

    Elasticsearch查询模式 一种是像传递URL参数一样去传递查询语句,被称为简单查询 GET /library/books/_search //查询index为library,type为boo ...

  6. Elasticsearch学习系列之配置文件详解

    ################################### Cluster ################################### #定义集群名称,默认是elasticse ...

  7. Elasticsearch学习系列之mapping映射

    什么是映射 为了能够把日期字段处理成日期,把数字字段处理成数字,把字符串字段处理成全文本(Full-text)或精确(Exact-value)的字符串值,Elasticsearch需要知道每个字段里面 ...

  8. Elasticsearch学习系列之多文档操作mget

    测试数据 GET /library/books/1 { "_index": "library", "_type": "books& ...

  9. Elasticsearch学习系列之单模式下API的增删改查操作

    这里我们通过Elasticsearch的marvel插件实现单模式下API的增删改查操作 索引的初始化操作 创建索引之前可以对索引进行初始化操作,比如先指定shard数量以及replicas的数量 代 ...

随机推荐

  1. django - raw sql - 注意点!

    现在的自己已经不怕mysql,已经熟悉了sql “搜索优化专家有时候都无法顾全所有,更何况ORM” 两种方法执行 sql原生语句 tablename.objects.raw() - 这样的语句,只能执 ...

  2. maven整合s2sh截图

  3. PHP实现站点pv,uv统计(一)

    具体步骤分为数据采集脚本,数据收取服务,数据分析脚本,数据存储服务 采集脚本一般有两种形式,一种是简单的页面插入一个图片进行请求,一种是复杂的动态生成js标签,引入一段js(这时采集服务器会网往客户端 ...

  4. android 语言切换过程分析

    android 语言切换过程分析 2014-02-27 18:13 1207人阅读 评论(0) 收藏 举报 语言切换android语言切换android改变语言 最近在看一个bug,系统切换语言后,本 ...

  5. HDU 3183 A Magic Lamp

    直接模拟   如果后一位比前一位小,那就一直 向前 pop()掉 维护他单调递增: #include<iostream> #include<cstring> #include& ...

  6. PHPMailer邮件类使用错误分析

    PHPMailer配置清单如下: require_once ‘class.phpmailer.php‘; $receiver = ”; $mail =  new PHPMailer ( ); $mai ...

  7. yii框架AR详解

    虽 然Yii DAO可以处理事实上任何数据库相关的任务,但很可能我们会花费90%的时间用来编写一些通用的SQL语句来执行CRUD操作(创建,读取,更新和删除). 同时我们也很难维护这些PHP和SQL语 ...

  8. hdu 1850 Being a Good Boy in Spring Festival(Nimm Game)

    题意:Nimm Game 思路:Nimm Game #include<iostream> #include<stdio.h> using namespace std; int ...

  9. Loadrunner中与事务相关的概念及函数

    一.事务 事务是指用户在客户端做一种或多种业务所需要的操作集,通过事务函数可以标记完成该业务所需要的操作内容:另一方面可以用来统计用户操作的相应时间.事务响应时间是指通过记录用户请求的开始时间和服务器 ...

  10. leetcode:Longest Substring Without Repeating Characters

    Given a string, find the length of the longest substring without repeating characters. For example, ...