0%

Interview Summary for NLP

总结一下六月份的面试经验

投简历

  • 在六月初投的暑期实习岗位,自然语言处理实习生。其实这个时间点很不好,处于暑期和春招之间青黄不接的时候,当我拿到offer快六月下旬的时候一大批hc就放出来了,而我当时主要在学校论坛上找内推或者直招,这种一般看当时公司的需求,我投了20份,大部分都是三四月份时发的帖,到六月份可能又缺一个名额才被顶上来,这种情况很难被捞到简历。
  • 最后是四家给了面试机会,京东广告、新浪微博、滴滴AI LAB、头条搜索。头条因为通知的太晚就没去了,而且当时完全是去裸面,没有任何准备,想想自己这么菜还是算了。
  • 平时刷题还是很重要(虽然我依然很懒不想刷),当时我一直忙着论文,忙完休息了个周末就直接投了,结果快的第二天就叫我去面试,实在是尴尬。
  • 面试一般都是两轮,大概一到两个小时。

京东广告

  • 一面着重问了简历上的内容,包括我做的几项评测和论文,讨论论文的动机、解决方法,对面也用类似的方法在做文本生成,就问了文本生成该如何评估质量、decoder训练如何保证不看到未来的信息,深度学习中常见的训练trick。
  • 抽取式文摘怎么构造特征,怎么抽取。
  • 讲述seq2seq的原理,分词的做法。讲述attention的作用及其变种。
  • 二面就让手写中序遍历的递归和非递归版本。

新浪微博

  • 只有leader一个人问,同样先问了简历上的内容
  • 手写最基础的attention和self attention过程,画一下bert的大致结构
  • 手写decoder生成每一个字的过程
  • 因为这边业务比较依赖bert,问了比较多bert的内容,例如如何用bert做文本分类,如何根据业务需求修改bert
  • 手写算法,链表判断环

滴滴AILAB

  • 滴滴是问的最详细最久的一个,也是两个人面,一面理论一面工程
  • 不知道是不是因为有做AI研究的需求,一面面试官把我的论文问的很详细,包括DPPs的计算过程,如何整合进seq2seq,为什么会出现OTR现象,这个现象有没有可能不是论文里分析的原因那样,而是由于encoder的过拟合导致的等等,感觉就像在做论文的rebut
  • 同样也问了seq2seq和attention的原理
  • 简单说明一下LDA的原理,如何用LDA做聚类,如何衡量LDA聚类的质量
  • 问了评测中三个任务:content linking, facet classification, extractive summarization具体是怎么做的
  • 写出一个简单DNN的前向后向过程
  • 问了git、awk、sed的一些操作
  • 算法手写归并排序