中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

從迪士尼到谷歌,他用推薦算法玩兒轉(zhuǎn)數(shù)據(jù)科學(xué)

2018-07-10    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用
魯穎,曾任美國(guó)迪士尼集團(tuán)首席數(shù)據(jù)科學(xué)家,他領(lǐng)導(dǎo)開(kāi)發(fā)了迪士尼的用戶個(gè)性化推薦系統(tǒng),在個(gè)性化推薦算法領(lǐng)域有著豐富經(jīng)歷,F(xiàn)任谷歌高級(jí)數(shù)據(jù)科學(xué)家,領(lǐng)導(dǎo) Google Play 數(shù)據(jù)科學(xué)團(tuán)隊(duì)。

數(shù)據(jù),讓一切有跡可循,讓一切有源可溯。

小到點(diǎn)外賣、逛淘寶,大至金融風(fēng)控、智慧城市......如今,我們每個(gè)人都是數(shù)據(jù)的生產(chǎn)者和受益者。在這樣的背景下,“數(shù)據(jù)科學(xué)”應(yīng)運(yùn)而生。

在數(shù)據(jù)科學(xué)家魯穎看來(lái),數(shù)據(jù)科學(xué)就是利用大數(shù)據(jù)的威力,科學(xué)系統(tǒng)地解決實(shí)際問(wèn)題的學(xué)科。

“一位優(yōu)秀的數(shù)據(jù)科學(xué)家,必須得是‘多面小能手’,除了過(guò)硬的技術(shù)、嚴(yán)謹(jǐn)?shù)乃季S,推理能力和溝通能力也是重中之重,大部分時(shí)間還要自己寫代碼同實(shí)際數(shù)據(jù)打交道。”魯穎說(shuō)道,“這需要很強(qiáng)的綜合能力。”坐在DT君面前接受采訪的他,在說(shuō)話時(shí),常常稍微抬起手比劃著習(xí)慣的動(dòng)作。

魯穎平時(shí)外表沉靜,但只要談及自己的職業(yè),他立刻就會(huì)開(kāi)始變得興奮,眼里閃爍著光芒。他曾任美國(guó)迪士尼集團(tuán)的首席數(shù)據(jù)科學(xué)家,已經(jīng)在數(shù)據(jù)科學(xué)行業(yè)耕耘多年,現(xiàn)服務(wù)于谷歌,任 Google Play 高級(jí)數(shù)據(jù)科學(xué)家。

作為統(tǒng)計(jì)學(xué)出身的博士,魯穎對(duì)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和人工智能等十分著迷。“我天生喜歡數(shù)學(xué),對(duì)數(shù)字特別敏感,是個(gè)有好奇心,并且喜歡鉆研。”

玩兒轉(zhuǎn)數(shù)據(jù)科學(xué)

對(duì)于魯穎來(lái)說(shuō),數(shù)據(jù)科學(xué)的魅力在于解決實(shí)際問(wèn)題,而不是僅僅局限于理論研究。

在迪士尼總部擔(dān)任首席數(shù)據(jù)科學(xué)家期間,他帶領(lǐng)團(tuán)隊(duì)進(jìn)行推薦系統(tǒng)的研發(fā),為迪士尼的網(wǎng)站、手機(jī)APP 等面向用戶的界面提供個(gè)性化推薦服務(wù):使用了包括用戶特征、瀏覽歷史記錄、瀏覽內(nèi)容屬性、以及用戶在迪士尼其他產(chǎn)品的關(guān)聯(lián)行為等上億級(jí)的數(shù)據(jù)。

他們嘗試了從最基本的協(xié)同過(guò)濾模型過(guò)渡到深度學(xué)習(xí)模型的算法研發(fā)和創(chuàng)新,對(duì)諸如點(diǎn)擊率、平均分位數(shù)排名等指標(biāo)進(jìn)行不斷的優(yōu)化,從而在離線和在線測(cè)試中,各項(xiàng)指標(biāo)較最初版均得到了超過(guò)百分之三百以上的提升,這讓魯穎直接感受到了數(shù)據(jù)科學(xué)的價(jià)值。

“我們團(tuán)隊(duì)的研發(fā)工作對(duì)于業(yè)務(wù)的幫助是顯而易見(jiàn)的。這種感覺(jué)很棒!”

魯穎介紹到,除了推薦系統(tǒng)外,迪士尼已經(jīng)把數(shù)據(jù)科學(xué)融入到了日常運(yùn)營(yíng)的方方面面。“迪士尼有很多事業(yè)部門,除了大家熟知的迪士尼樂(lè)園部和影視部,它還有商城部、互動(dòng)媒體部等等,每個(gè)部門都有數(shù)據(jù)科學(xué)家團(tuán)隊(duì)作為迪士尼的大腦,為業(yè)務(wù)提供支持和決策。”

以迪士尼樂(lè)園部為例,魯穎提到了其前幾年推出的迪士尼手環(huán),游客在游玩項(xiàng)目之前需要掃一下手環(huán),通過(guò)對(duì)群體手環(huán)數(shù)據(jù)的分析,迪士尼樂(lè)園可以知道游客對(duì)各個(gè)游樂(lè)項(xiàng)目的喜好,從而優(yōu)化派發(fā)快速通道卡的方式,精準(zhǔn)預(yù)測(cè)排隊(duì)等候時(shí)間,建議優(yōu)化的游玩路線等。“誰(shuí)都不愿意花大把時(shí)間在太陽(yáng)下排隊(duì),一個(gè)小小的數(shù)據(jù)手環(huán)就能解決這些問(wèn)題。由此可見(jiàn),數(shù)據(jù)科學(xué)的確可以給整個(gè)樂(lè)園的運(yùn)營(yíng)效率和游客體驗(yàn)帶來(lái)提升。”

 

 

(圖片說(shuō)明:迪士尼樂(lè)園;圖片來(lái)源:視覺(jué)中國(guó))

離開(kāi)迪士尼后,魯穎加入谷歌,負(fù)責(zé)其應(yīng)用商城(Google Play)的數(shù)據(jù)科學(xué)部門,團(tuán)隊(duì)工作主要包括“基于數(shù)據(jù)分析的指標(biāo)設(shè)定、實(shí)驗(yàn)的科學(xué)性設(shè)計(jì)和實(shí)驗(yàn)數(shù)據(jù)分析、統(tǒng)計(jì)算法的研究以及基于機(jī)器學(xué)習(xí)的用戶行為分析和預(yù)測(cè)等,包括用戶畫(huà)像模型,用戶流失模型和個(gè)性化推薦模型。”

從迪士尼到谷歌,公司環(huán)境的改變給他帶來(lái)了更多的成長(zhǎng)空間。以谷歌的超大規(guī)模數(shù)據(jù)作為基礎(chǔ),他再一次嘗試通過(guò)數(shù)據(jù)科學(xué)的理念研究如何提升用戶體驗(yàn)。

“我們應(yīng)用商城的個(gè)性化推薦算法對(duì)于優(yōu)化產(chǎn)品體驗(yàn)有著巨大的幫助”,他介紹道,基于用戶的歷史瀏覽記錄、用戶畫(huà)像和 APP 畫(huà)像,個(gè)性化推薦算法可以為用戶推薦一個(gè)他們最有可能點(diǎn)擊或者下載的 APP ,應(yīng)用商城的效率因此比兩年前提升了一倍以上。

“數(shù)據(jù)讓事情變得可度量,數(shù)據(jù)維度能夠清晰的描繪事實(shí),且更具說(shuō)服力。” 數(shù)據(jù)之于魯穎,絕非單調(diào)的一組組數(shù)字排列,他認(rèn)為,很多時(shí)候,新的機(jī)會(huì)本身就藏在數(shù)據(jù)里,只是需要數(shù)據(jù)科學(xué)家們進(jìn)行深度挖掘。

魯穎曾經(jīng)所做過(guò)的一個(gè)用戶流失模型,這個(gè)模型本身并不復(fù)雜,但在具體分析中,要理解哪些用戶流失概率高,有何共同點(diǎn),哪些特征可以刻畫(huà)該人群等眾多問(wèn)題,就需要對(duì)用戶進(jìn)行特征分析和聚類分析,即所謂的用戶畫(huà)像。再往下深挖,對(duì)于用戶流失的原因和防止流失的解決方案(通過(guò)消息觸達(dá)提供折扣券等),都要從數(shù)據(jù)中進(jìn)行因果分析的挖掘和建模。只有真正理解用戶的痛點(diǎn),才能根本地解決流失問(wèn)題。其中每個(gè)環(huán)節(jié)都需要對(duì)實(shí)際商業(yè)場(chǎng)景和數(shù)據(jù)有深刻理解。

AI能讓人類更聚焦于創(chuàng)新和挑戰(zhàn)

對(duì)于數(shù)據(jù)科學(xué),大部分人的認(rèn)知或許源自 AI 技術(shù),在經(jīng)典科幻電影《機(jī)械公敵》里,以大數(shù)據(jù)為支撐的機(jī)器人在制造過(guò)程中,曲解了之前為他們所設(shè)定并且保護(hù)人類安全的機(jī)器人三定律,產(chǎn)生了機(jī)器人和人類之間的沖突,而人工智能源于人類制造卻高于人類的能力在對(duì)抗過(guò)程之中帶來(lái)了巨大優(yōu)勢(shì),人類因此節(jié)節(jié)敗退。

我們目前正在發(fā)展的 AI 技術(shù),是否真的會(huì)把我們推向影片描繪的將來(lái)。

“我覺(jué)得 AI 會(huì)部分取代人的工作,尤其是那部分繁重、重復(fù)、靠大量人力的,并且依賴于經(jīng)驗(yàn)的工作或者是標(biāo)準(zhǔn)化的任務(wù)。”談及人工智能的未來(lái),魯穎給出了自己的看法。

對(duì)于“ AI 取代人工”說(shuō),魯穎認(rèn)為,人們正確的應(yīng)對(duì)方式是把注意力放在創(chuàng)新性的任務(wù)上,同時(shí)科學(xué)理性地評(píng)判機(jī)器可以做到和不可以做到的,不過(guò)度夸大或者低估算法的能力,“還有就是開(kāi)發(fā)新的人工智能產(chǎn)品,把機(jī)器擅長(zhǎng)的工作交給他們?nèi)ネ瓿伞?rdquo;

“現(xiàn)在利用機(jī)器學(xué)習(xí)在有些場(chǎng)景可以毫秒級(jí)得出比人更準(zhǔn)確的結(jié)果,并且直接帶來(lái)收入。”在魯穎看來(lái),目前機(jī)器學(xué)習(xí)在很多領(lǐng)域的技術(shù)變革和創(chuàng)新過(guò)程中起著主力推動(dòng)的作用,特別是依靠人力以及經(jīng)驗(yàn)推斷支撐的行業(yè)。比如金融風(fēng)控就是個(gè)典型的例子,以前需要人力收集數(shù)據(jù),憑經(jīng)驗(yàn)判斷人靠不靠譜,現(xiàn)在機(jī)器可以自動(dòng)打分;生產(chǎn)線上有大量需要產(chǎn)品質(zhì)檢的,現(xiàn)在大部分也可以交給智能攝像頭去區(qū)分產(chǎn)品是否有缺陷;不少機(jī)場(chǎng)還借助人工智能攝像頭核對(duì)人和護(hù)照上的人像是否一致。這些都屬于定義很清晰的標(biāo)準(zhǔn)化任務(wù)。

 

 

(圖片說(shuō)明:魯穎在美國(guó)谷歌總部)

“我覺(jué)得未來(lái)我們的生活會(huì)越來(lái)越方便。隨著機(jī)器人技術(shù)和諸如無(wú)人車的研發(fā),很多繁重的、重復(fù)性的甚至危險(xiǎn)的工作都會(huì)讓機(jī)器去完成。人們的注意力會(huì)更多地放在創(chuàng)新和更有挑戰(zhàn)的工作上。長(zhǎng)期來(lái)看這是好事。”魯穎說(shuō)道。

聚焦機(jī)器學(xué)習(xí)技術(shù)的業(yè)界應(yīng)用,魯穎的建議是,業(yè)界應(yīng)該把數(shù)據(jù)驅(qū)動(dòng)作為核心價(jià)值觀的一部分,保持一種開(kāi)放的態(tài)度,鼓勵(lì)員工多提問(wèn)題和解決方案,鼓勵(lì)數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新。比如,有沒(méi)有可能把人的經(jīng)驗(yàn)用機(jī)器學(xué)出來(lái),并且自動(dòng)化和規(guī);。

“促銷投放就是個(gè)典型的例子,什么人群對(duì)什么促銷感興趣,完全可以以機(jī)器學(xué)習(xí)建模為核心,建立一套自動(dòng)化的端到端的解決方案。一線的數(shù)據(jù)科學(xué)家和算法工程師在很多時(shí)候會(huì)在數(shù)據(jù)分析和挖掘的過(guò)程中有著獨(dú)到的發(fā)現(xiàn)和見(jiàn)解,公司應(yīng)該鼓勵(lì)和尊重這些,并允許他們花一定的時(shí)間去嘗試新的想法和一定程度內(nèi)的試錯(cuò)。”魯穎說(shuō)到。

永遠(yuǎn)對(duì)數(shù)據(jù)保持敬畏

如今,創(chuàng)造、使用大數(shù)據(jù)已成為日常,可越來(lái)越多的濫用用戶數(shù)據(jù)丑聞?dòng)植唤屓?ldquo;談數(shù)色變”。在對(duì)話過(guò)程中,魯穎強(qiáng)調(diào)最多的一句話就是,“和數(shù)據(jù)打交道,一定要尊重?cái)?shù)據(jù),尊重用戶,用嚴(yán)謹(jǐn)?shù)膽B(tài)度去使用數(shù)據(jù)。”

就近來(lái)沸沸揚(yáng)揚(yáng)的 Facebook (臉書(shū))泄密門,他也表達(dá)了自己的看法,“我舉雙手支持用戶數(shù)據(jù)保護(hù),5月底剛生效的歐盟‘史上最嚴(yán)’數(shù)據(jù)保護(hù)新規(guī),就是個(gè)很好的舉措和開(kāi)端。”他還透露,谷歌很多部門花了近一年時(shí)間,對(duì)數(shù)據(jù)的存儲(chǔ)和使用規(guī)范進(jìn)行了改進(jìn),比如保證用戶刪除數(shù)據(jù)后,無(wú)法再利用他刪除的數(shù)據(jù)做個(gè)性化推薦等。“數(shù)據(jù)是用戶的,他們有權(quán)利決定分享與否,我們理應(yīng)尊重和保護(hù)。對(duì)數(shù)據(jù)的使用應(yīng)該在合理的范圍內(nèi)進(jìn)行,不能以用戶隱私為代價(jià)。”

雖然相比美國(guó)起步較晚,但中國(guó)的數(shù)據(jù)科學(xué)行業(yè)正在以前所未有的速度發(fā)展。從2017年開(kāi)始,有越來(lái)越多的華人數(shù)據(jù)科學(xué)家選擇回國(guó)。擁有眾多光環(huán)加身的魯穎,最近也在考慮回國(guó),他非常支持?jǐn)?shù)據(jù)科學(xué)家回國(guó)發(fā)展。他覺(jué)得,在美國(guó)的學(xué)習(xí)和工作經(jīng)歷十分寶貴,如果最終能把這份經(jīng)驗(yàn)和前沿技術(shù)與中國(guó)的實(shí)際需求場(chǎng)景進(jìn)行碰撞,對(duì)中國(guó)的科技發(fā)展將會(huì)有很大的幫助。

“我希望中國(guó)對(duì)于數(shù)據(jù)科學(xué)能保持持續(xù)的重視,堅(jiān)信數(shù)據(jù)驅(qū)動(dòng)價(jià)值,給予數(shù)據(jù)科學(xué)家足夠的尊重和廣闊的平臺(tái),讓他們發(fā)揮才能,解決有意義、有挑戰(zhàn)性的問(wèn)題。”

對(duì)話期間,魯穎多次提及對(duì)于數(shù)據(jù)科學(xué)的實(shí)用理念,講述自己從事的工作時(shí)也往往告訴我們數(shù)據(jù)科學(xué)能夠給我們帶來(lái)的究竟是什么。對(duì)于這一行業(yè),他極力歡迎年輕人在興趣的基礎(chǔ)之上加入。

他告訴我們,如果時(shí)間能夠再重來(lái)一次,他還是會(huì)選擇數(shù)據(jù)科學(xué)這條道路——在本科數(shù)學(xué)系畢業(yè)之后出國(guó)留學(xué),到美國(guó)讀取一個(gè)博士學(xué)位,再加入谷歌微軟之類的老牌巨頭,之后把學(xué)到的技術(shù)和做事風(fēng)格和理念帶回國(guó)內(nèi)。

也許過(guò)程會(huì)有不同,但是不變的是對(duì)數(shù)據(jù)科學(xué)的追求,對(duì)數(shù)據(jù)驅(qū)動(dòng)價(jià)值的信仰。

魯穎博士,本科畢業(yè)于復(fù)旦大學(xué)數(shù)學(xué)系,博士畢業(yè)于美國(guó)明尼蘇達(dá)大學(xué)統(tǒng)計(jì)系。曾就職于美國(guó)迪士尼集團(tuán)首席數(shù)據(jù)科學(xué)家,現(xiàn)任谷歌 Google Play 高級(jí)數(shù)據(jù)科學(xué)家。他還是《Keras快速上手:基于Python的深度學(xué)習(xí)實(shí)戰(zhàn)》一書(shū)主要作者之一。

標(biāo)簽: Google 安全 大數(shù)據(jù) 代碼 谷歌 金融 媒體 排名 數(shù)據(jù)分析

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:想成為數(shù)據(jù)科學(xué)家,這 4 個(gè)坑千萬(wàn)別踩

下一篇:一個(gè)Python特征選擇工具,助力實(shí)現(xiàn)高效機(jī)器學(xué)習(xí)