Dell EMC数据保护部门实习生面试

时间:2019-08-11 来源:www.9vidz.com

新濠天地娱乐网址

  这个实习是7月初投递的,7月15日下午4点左右电话一面,当天面试完没过多久就预约了第二天[7月16日]下午二面。

  一面电话面,面试官所问的问题范围都比较大,主要让介绍了项目,还有基本上我简历上涉及到的算法都让我回答了一遍自己的认识。

  一面和二面的面试官没有来得及沟通,所以还是重新对我进行了一个基本的技术上的了解。

  二面技术面,还是针对简历上的来挖的知识点,比一面要更详细一点,主要的问题包括:

  Q:简单介绍一下简历上的项目【回答:项目最终目的,feature,target,项目中涉及到的技术点】

  项目中涉及到的编码【我结合项目特征介绍的One-hot编码】

  因为项目中涉及到了RandomForest和GBDT,相当于RF的效果最好,有没有考虑过为什么RF的效果会比GBDT的效果好?【没回答上来】

  项目是独立完成还是小组,你的主要工作在哪一部分?【小组形式,前期数据的一个处理,数据挖掘】

  你的项目中还有写到一个网上的在线课程学习,这个课程中你有加入到自己的想法或者处理什么的?【课程就是让接触到项目,项目的结果会从网上搜索进行结果的对比,相当于结果还是参照了部分网络上的结果】

  使用python进行机器学习有多长时间?

  关于实习经历的询问

  Q:简单介绍一下实习经历的工作过程,自己的工作以及对于这个问题的了解。

  Q:挑选一种机器学习算法讲讲自己的理解【LR 基本的思想 目标假设、损失函数、优化过程 输入数据的归一化? 用? 用正则化项防止过拟合】

  LR用在你的平常中的项目中优点在哪,缺点在哪?【容易出现过拟合,容易受到异常点的影响】

  用LR+GBDT组合式的训练有做过吗?【没有】

  Q:本科的绩点

  Q:Bagging和Boosting的最大的区别【样本使用】

  Bagging和Boosting的各自的优劣以及对应方法的举例【Bagging:RF Boosting:Adaboost、xgboost、GBDT】

  Q:研究生的主修课程

  Q:自我介绍

  因为表达了自己想积累一些机器学习领域的经验,所以面试官就对公司以及涉及到的机器学习领域的项目进行了介绍,表达了项目中可能不仅仅涉及到机器学习,希望我能做好衡量。

  Q:机器学习的库有用过哪些?【sklearn、tensorflow】

  Q:在数据清洗中遇到的数据噪音[异常数据]【缺省值】

  对于缺省值的处理【结合项目说明了少量缺失值的处理】

  版本问题造成的不同程度上的缺省值有遇到吗?比如旧版本到新版本的数据会有一部分feature缺省,但是这种数据我们还是需要的,在投入模型之前应该怎么处理?【这个不太清楚】

  在投入模型之前,做特征选择和特征除噪的方法,你有了解过吗?【接触过模型所做的特征选择,未知模型选择之前,没有接触过太多 统计类的方法接触过一点】

  数据可视化分析,主要用过什么样的可视化方法?【柱状图 热力图 散点图】

  有没有多维度数据的可视化分析?【没有接触过】

  Q:英语六级的成绩

  三面,领导面

  Q:暑期现在在做什么【学习tensorflow】

  Q:以你现在的理解讲解一下tensorflow,为什么需要tensorflow,它主要解决的什么问题?

  Q:实习经历中提到了数据清洗,讲解一下清洗的工作是怎么做的?

  Q:写程序写的多吗?用什么语言?

  Q:学过操作系统吗,C++用的多吗?

  Q:有哪些意向企业?

  Q:选择这个方向的原因,兴趣还是因为热门?

  Q:描述一下随机森林

  Q:随机森林主要用于解决什么类的问题?

  Q:你知道Dell EMC吗?有多少了解

  Q:对外企有什么了解?自己想去什么样子的?

  然后领导就和我介绍了一部分部门的工作内容以及将来的一个目标设想,让我考虑好可能在将来机器学习同时会涉及到一部分研发,而且表示招实习生希望能比较稳定,培养完表现好希望能留下来,让我能做好自己的考虑。中途领导总给我说让我考虑这个实习是不是兴趣所在,然后就不说话了,尬了,不知道是不是希望我表达一个很正面的、积极的意愿?

  然后就完了,这是不是已经凉了怎么感觉实习也这么难

达到当天最大量