总结一下六月份的面试经验
投简历
- 在六月初投的暑期实习岗位,自然语言处理实习生。其实这个时间点很不好,处于暑期和春招之间青黄不接的时候,当我拿到offer快六月下旬的时候一大批hc就放出来了,而我当时主要在学校论坛上找内推或者直招,这种一般看当时公司的需求,我投了20份,大部分都是三四月份时发的帖,到六月份可能又缺一个名额才被顶上来,这种情况很难被捞到简历。
- 最后是四家给了面试机会,京东广告、新浪微博、滴滴AI LAB、头条搜索。头条因为通知的太晚就没去了,而且当时完全是去裸面,没有任何准备,想想自己这么菜还是算了。
- 平时刷题还是很重要(虽然我依然很懒不想刷),当时我一直忙着论文,忙完休息了个周末就直接投了,结果快的第二天就叫我去面试,实在是尴尬。
- 面试一般都是两轮,大概一到两个小时。
京东广告
- 一面着重问了简历上的内容,包括我做的几项评测和论文,讨论论文的动机、解决方法,对面也用类似的方法在做文本生成,就问了文本生成该如何评估质量、decoder训练如何保证不看到未来的信息,深度学习中常见的训练trick。
- 抽取式文摘怎么构造特征,怎么抽取。
- 讲述seq2seq的原理,分词的做法。讲述attention的作用及其变种。
- 二面就让手写中序遍历的递归和非递归版本。
新浪微博
- 只有leader一个人问,同样先问了简历上的内容
- 手写最基础的attention和self attention过程,画一下bert的大致结构
- 手写decoder生成每一个字的过程
- 因为这边业务比较依赖bert,问了比较多bert的内容,例如如何用bert做文本分类,如何根据业务需求修改bert
- 手写算法,链表判断环
滴滴AILAB
- 滴滴是问的最详细最久的一个,也是两个人面,一面理论一面工程
- 不知道是不是因为有做AI研究的需求,一面面试官把我的论文问的很详细,包括DPPs的计算过程,如何整合进seq2seq,为什么会出现OTR现象,这个现象有没有可能不是论文里分析的原因那样,而是由于encoder的过拟合导致的等等,感觉就像在做论文的rebut
- 同样也问了seq2seq和attention的原理
- 简单说明一下LDA的原理,如何用LDA做聚类,如何衡量LDA聚类的质量
- 问了评测中三个任务:content linking, facet classification, extractive summarization具体是怎么做的
- 写出一个简单DNN的前向后向过程
- 问了git、awk、sed的一些操作
- 算法手写归并排序