面試經(jīng)驗(yàn)分享之機(jī)器學(xué)習(xí)與大數(shù)據(jù)問題
本人的專業(yè)方向是機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘,就業(yè)意向是互聯(lián)網(wǎng)行業(yè)與本專業(yè)相關(guān)的工作崗位。各個(gè)企業(yè)對(duì)這類崗位的命名可能有所不同,比如數(shù)據(jù)挖掘/自然語言處理/機(jī)器學(xué)習(xí)算法工程師,或簡稱算法工程師,還有的稱為搜索/推薦算法工程師,甚至有的并入后臺(tái)工程師的范疇,視崗位具體要求而定。
機(jī)器學(xué)習(xí)、大數(shù)據(jù)相關(guān)崗位的職責(zé)
自己參與面試的.提供算法崗位的公司有 BAT、小米、360、飛維美地、宜信、猿題庫 等,根據(jù)業(yè)務(wù)的不同,崗位職責(zé)大概分為:
1、平臺(tái)搭建類數(shù)據(jù)計(jì)算平臺(tái)搭建,基礎(chǔ)算法實(shí)現(xiàn),當(dāng)然,要求支持大樣本量、高維度數(shù)據(jù),所以可能還需要底層開發(fā)、并行計(jì)算、分布式計(jì)算等方面的知識(shí);
2、算法研究類文本挖掘,如領(lǐng)域知識(shí)圖譜構(gòu)建、垃圾短信過濾等;推薦,廣告推薦、APP 推薦、題目推薦、新聞推薦等;排序,搜索結(jié)果排序、廣告排序等;廣告投放效果分析;互聯(lián)網(wǎng)信用評(píng)價(jià);圖像識(shí)別、理解。
3、數(shù)據(jù)挖掘類商業(yè)智能,如統(tǒng)計(jì)報(bào)表;用戶體驗(yàn)分析,預(yù)測流失用戶。
以上是根據(jù)本人求職季有限的接觸所做的總結(jié)。有的應(yīng)用方向比較成熟,業(yè)界有足夠的技術(shù)積累,比如搜索、推薦,也有的方向還有很多開放性問題等待探索,比如互聯(lián)網(wǎng)金融、互聯(lián)網(wǎng)教育。在面試的過程中,一方面要盡力向企業(yè)展現(xiàn)自己的能力,另一方面也是在增進(jìn)對(duì)行業(yè)發(fā)展現(xiàn)狀與未來趨勢的理解,特別是可以從一些剛起步的企業(yè)和團(tuán)隊(duì)那里,了解到一些有價(jià)值的一手問題。
以下首先介紹面試中遇到的一些真實(shí)問題,然后談一談答題和面試準(zhǔn)備上的建議。
面試問題1、你在研究/項(xiàng)目/實(shí)習(xí) 經(jīng)歷中主要用過哪些機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘的算法?2、你熟悉的機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘算法主要有哪些?3、你用過哪些機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘工具或框架?4、基礎(chǔ)知識(shí)
無監(jiān)督和有監(jiān)督算法的區(qū)別?SVM 的推導(dǎo),特性?多分類怎么處理?LR 的推導(dǎo),特性?決策樹的特性?SVM、LR、決策樹的對(duì)比?GBDT 和 決策森林 的區(qū)別?如何判斷函數(shù)凸或非凸?解釋對(duì)偶的概念。如何進(jìn)行特征選擇?為什么會(huì)產(chǎn)生過擬合,有哪些方法可以預(yù)防或克服過擬合?介紹卷積神經(jīng)網(wǎng)絡(luò),和 DBN 有什么區(qū)別?采用 EM 算法求解的模型有哪些,為什么不用牛頓法或梯度下降法?用 EM 算法推導(dǎo)解釋 Kmeans。用過哪些聚類算法,解釋密度聚類算法。聚類算法中的距離度量有哪些?如何進(jìn)行實(shí)體識(shí)別?解釋貝葉斯公式和樸素貝葉斯分類。寫一個(gè) Hadoop 版本的 wordcount。
【面試經(jīng)驗(yàn)分享之機(jī)器學(xué)習(xí)與大數(shù)據(jù)問題】相關(guān)文章:
面試問題之經(jīng)驗(yàn)態(tài)度06-02
四大面試經(jīng)驗(yàn)分享01-15
分享面試經(jīng)驗(yàn)12-04
面試問題之5大“最”06-09