2019-08-26 17:19:58

1)聊实习项目

2)代码题,二维数组中的查找某个target

3)讲一些最能体现创新能力的工作,而不是一些工程上的实现

4)讲论文可以从哪些方面做创新点,文本生成的结果怎么排序

5)部门是做任务型聊天机器人的
 
 
第一个开始面试的公司,一开始没找内推,被互娱的组捞了。
3.8 一面,聊项目,然后计算机基础(dns),最后一道算法题,比较愉快。面完两小时接到电话邀请二面,时间定在3.12(这里可能时间定太晚了?)
3.12 二面,项目+一道算法,但还是准备不多,有些东西忘了,对前沿技术讨论的时候有几个点我说的有问题,面试官评价是做的很多,基础要多把握
3.28 一面,惯例项目介绍一波。但对方明显对nlp和深度学习相对不是很感兴趣? 话题转移到数学,“τ分布是啥" "..." "极限知道吗" ”知道点,比如求梯度求斜率的时候可以用到“ "呵呵" 猝 转移到基础算法的原理,“分类,聚类xxxxxxx哪个熟。” “分类吧” “哪种” “有哪些?” “lr,svm,xxxxx神经网络” "那就神经网络吧" "太简单了,不问了" 猝 "xgboost和adaboost原理" "...." 疙疙瘩瘩答了一些原理。
“你对机器学习还停留在理论阶段啊” 猝 .... "我找了nlp内推,如果觉得我不ok的话,就把我转走或者灰掉吧" "我这里了解你的情况了,会处理的" 然后过一个小时变复试。。
更新: 30号晚上leader加微信,31号下午二面,晚上状态变成已完成
 
 
1.重复数字的二分查找,找到始末位置
问了问最近两年的腾讯广告算法比赛有什么不一样。
问了个场景题,如果有用户历史的阅读文章,怎么做兴趣点的挖掘。
问了问文本的分类算法。
问了个给一个query,怎么找相关的文章。
匹配和检索算法。
都有哪些方法,没怎么扣细节。
感觉对NLP问的比较多。问了两遍工作城市意向。
后面找了个HR,发起了个正式的流程。
 
 
内推的是自己的学长。一面的是深圳分部的同事,人很好,自己正好有一点network让他认识了我,所以就捞了简历。面试内容很大一部分都是详细问了做过的项目,包括每一步是如何实现的,想法怎么来的。涉及到NLP的问题,问了有word2vec skip-gram的原理,negative sampling怎么做,为什么这么做,如何加速word2vec的训练。attention的机制,lstm和gru的原理,为什么可以解决梯度消失的问题。以及对于我做的一个跨语言情感分析的项目,还详细问了如何区分并提取每个语言不同的特征以及共同的特征。问了大约1h就说会尽快安排二面。
二面是同一天的晚上,是来自美国分部的同事,重点问了我之前发表论文的课题,包括我在其中负责的部分,对于时序数据的处理等。具体涉及NLP的问题,问了防止过拟合的做法,dropout的原理,batch normalization的原理,maxout激活函数的原理,因为我最近的课题用了Attent is all you need里的position embedding和Multihead的做法,他也详细问了各个步骤和原理,因为是晚上比较晚开始的面试,所以问了半小时就结束了。
hr面是第二天的晚上七点好像是,也是深圳的同事,问了简历中暑期科研的课题,我的背景,自己希望的工作地点这样。
然而等offer等了11天。。虽然中间有清明,但是流程还是过了很久。
 
  • 一面:

    • 项目介绍;
    • viterbi解码原理,code;beamsearch;
    • 代码:一道hash的题,忘了;
  • 二面:
    • 项目介绍;
    • BN介绍(为什么加速收敛,从SGD更新角度和weight scale角度),dropout介绍,训练测试差异;
    • 代码:二分查找的题,绝对值;
  • 三面(总监):
    • 聊项目;

NLP interview的更多相关文章

  1. CrowdFlower Winner's Interview: 1st place, Chenglong Chen

    CrowdFlower Winner's Interview: 1st place, Chenglong Chen The Crowdflower Search Results Relevance c ...

  2. 【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理

    干货!详述Python NLTK下如何使用stanford NLP工具包 作者:白宁超 2016年11月6日19:28:43 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的 ...

  3. 【NLP】十分钟快览自然语言处理学习总结

    十分钟学习自然语言处理概述 作者:白宁超 2016年9月23日00:24:12 摘要:近来自然语言处理行业发展朝气蓬勃,市场应用广泛.笔者学习以来写了不少文章,文章深度层次不一,今天因为某种需要,将文 ...

  4. 【NLP】前戏:一起走进条件随机场(一)

    前戏:一起走进条件随机场 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有 ...

  5. 【NLP】蓦然回首:谈谈学习模型的评估系列文章(一)

    统计角度窥视模型概念 作者:白宁超 2016年7月18日17:18:43 摘要:写本文的初衷源于基于HMM模型序列标注的一个实验,实验完成之后,迫切想知道采用的序列标注模型的好坏,有哪些指标可以度量. ...

  6. 【NLP】Python NLTK处理原始文本

    Python NLTK 处理原始文本 作者:白宁超 2016年11月8日22:45:44 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开 ...

  7. 【NLP】Python NLTK获取文本语料和词汇资源

    Python NLTK 获取文本语料和词汇资源 作者:白宁超 2016年11月7日13:15:24 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集 ...

  8. NLP点滴——文本相似度

    [TOC] 前言 在自然语言处理过程中,经常会涉及到如何度量两个文本之间的相似性,我们都知道文本是一种高维的语义空间,如何对其进行抽象分解,从而能够站在数学角度去量化其相似性.而有了文本之间相似性的度 ...

  9. Pramp mock interview (4th practice): Matrix Spiral Print

    March 16, 2016 Problem statement:Given a 2D array (matrix) named M, print all items of M in a spiral ...

随机推荐

  1. 餐厅随评系列之四:Umu日本料理(米其林二星)

    文章目录 在过去的几个月,工作和生活都极其忙碌,因此博客短暂停更了一阵子.慢慢积累下了很多素材,从近期开始恢复博客更新,不过很多内容估计得靠回忆了. 索性采取"倒叙"的方法,先从最 ...

  2. Vue数据绑定(一)

    Contents Vue作为当下炙手可热的前端三大框架之一,一直都想深入研究一下其内部的实现原理,去学习MVVM模式的精髓.如果说MVVM是当下最流行的图形用户界面开发模式,那么数据绑定则是这一模式的 ...

  3. 3D打印如何重组制造格局?

    ​全球化的竞争正变得毫无底线,国与国之间只有利益,没有同情,也就是说美国品牌想把自己的工厂移回本土,是不会考虑中国工人的生存现状的,更不会顾及这里的GDP和环境问题,甚至还会依靠经济能力去奴役其他国家 ...

  4. 使用Lucene.Net做一个简单的搜索引擎-全文索引

    Lucene.Net Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎. ...

  5. tcpdump常用方法

    tcpdump -i eth0监视制定网络接口的数据包 tcpdump host 10.13.1.135监视所有10.13.1.135主机收到和发出的数据包 tcpdump src host 10.1 ...

  6. python爬虫-纠正MD5错误认知

    m = md5(".encode()) print(m.hexdigest()) # 25d55ad283aa400af464c76d713c07ad m = md5(".enco ...

  7. Windows Server 2012搭建SQL Server Always On踩坑全记录

    Windows Server 2012搭建SQL Server Always On踩坑全记录 环境信息: Windows Server 2012 R2 Sql Server 2012 整个搭建集群的过 ...

  8. Windows激活服务器搭建

    1.下载服务端的安装包,下载地址: https://github.com/Wind4/vlmcsd/releases 注意,下载编译好的包省时间,名称为:binaries.tar.gz 或者直接下载我 ...

  9. 基于Vue的机器学习平台前端

    项目演示地址:http://vidanao.com/ml>注意1:前端兼容性不太好,360浏览器比较兼容; >注意2:此vidanao.com也是我的个人博文主页,但目前还没部署 源码地址 ...

  10. Vmware安装的linux系统开机黑屏,关闭显示虚拟机忙怎么怎么解决?

    在vm虚拟机中,可能会遇到打开一台主机直接黑屏,而且无法关闭,关闭会显示虚拟机繁忙这种情况,如下图: 一般是因为没有正常关机或者操作不当导致的   对此,解决办法一般有两种 第一种方法: 1.重启电脑 ...