中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

我是如何建立完美的數(shù)據(jù)科學團隊

2019-10-10    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

by Jean Georges Perrin 來源:DZone

當我組建第一個數(shù)據(jù)科學團隊時,這個術(shù)語在《哈佛商業(yè)評論》上幾乎沒有印出來。我不知道我正在組建一支在大數(shù)據(jù)和數(shù)據(jù)科學領(lǐng)域處于先驅(qū)地位的團隊。現(xiàn)在是反思這個十二年前開始的故事的好時機。

首先,我真的很想為這篇文章冠以“我如何建立一支完美的數(shù)據(jù)科學團隊(不知道如何)”的標題。但是,我不想給人留下我不知道自己在做什么的印象(我認為我做了) 。不過,這是我的故事...

2007年,我創(chuàng)立了GreenIvory。這個想法是為網(wǎng)絡(luò)營銷人員建立一個工具箱。無論營銷人員是想要自動化內(nèi)容分發(fā),內(nèi)容生成,還是通過情感分析來衡量品牌知名度,我們都有一個解決方案(還有更多解決方案!)。不久之后,該團隊開始研究NLP(自然語言處理),并于2011年初發(fā)布了首款可進行情感分析的產(chǎn)品。我們解決了許多技術(shù)難題,但我們將重點放在人員和組織方面。

“green team”由一群才華橫溢的軟件工程師組成。每位工程師在系統(tǒng)的各個關(guān)鍵要素上都有自己的強項:UI,數(shù)據(jù),爬蟲,系統(tǒng),操作等。我們之前已經(jīng)推出了幾個項目和產(chǎn)品。這是一個工作模型。然而,我們沒有足夠的科學。 我們需要可以幫助我們將科學知識注入工程團隊的人。 那時我們與斯特拉斯堡大學合作,聘請了一位數(shù)據(jù)科學家(當時他并沒有這個頭銜)。

時間軸和業(yè)務(wù)價值

 

 

我們的主要問題是時間表;蚋_切地說,數(shù)據(jù)科學與工程學之間缺乏一致性。那時,我們已經(jīng)在遵循敏捷方法論。與當時的大多數(shù)公司一樣,它是本地生產(chǎn)的版本,但它是團隊驅(qū)動的,我們擁有一個出色的敏捷冠軍。運行正常。

每個Sprint都在交付業(yè)務(wù)價值,我們經(jīng)常在開發(fā)過程中更新工件,面臨的挑戰(zhàn)就是將科學家的工作在工程組織。

 

 

歸結(jié)為將他直接整合到開發(fā)團隊中。我希望他充當燈塔。這并不容易。有點文化沖突。工程師們不明白為什么要花這么多時間來獲取東西,以及為什么要花這么多時間來做。在他的身邊,這位科學家無法理解為什么他的實驗雖然在Mac上取得了成功,但是當我們向他的算法拋出數(shù)百萬個句子時卻無法擴展。

最后,經(jīng)過無數(shù)次結(jié)對編程,討論并建立了更強的團隊合作精神,我們得以在產(chǎn)品中利用科學。

反例

 

 

最近,我經(jīng)歷了一個不同的組織,數(shù)據(jù)科學家被停在一個筒倉中。當時的想法是將科學作為一種面向消費者的產(chǎn)品交付給業(yè)務(wù)分析師和用戶。

不要誤會我的意思,他們能夠交付,但是筒倉仍然是筒倉。團隊積累的知識和智慧并沒有滲透到組織的其他部門。

副作用是該團隊不斷發(fā)展,最終與另一個團隊合并……您知道發(fā)生了什么:他們需要更多的披薩。而且,當您需要更多披薩時,生產(chǎn)率就會下降。如果不在原始的《敏捷宣言》中,則必須在其第一個修訂中。

十二年來的數(shù)據(jù)科學團隊

最近,我在Think 2019上參加了Stacey Ronaghan的鼓舞人心的演講。Ronaghan是IBM的數(shù)據(jù)科學家。她正在總結(jié)自己作為數(shù)據(jù)科學家的經(jīng)驗,并加入了一個團隊。那時我才意識到,十二年前,我們相距不遠。

 

 

她將團隊定義為成功的關(guān)鍵驅(qū)動力。她與之合作的團隊在數(shù)據(jù)科學領(lǐng)域扮演著不同的角色,例如高管發(fā)起人,數(shù)據(jù)庫管理員(該公司負責處理數(shù)據(jù)!),業(yè)務(wù)分析師,項目經(jīng)理(在2019年,我們稱為Scrum Masters),SME(主題專家) ),解決方案架構(gòu)師,軟件工程師,設(shè)計師和設(shè)計思維實踐者。是的,這是一個非常折衷且具有跨職能的團隊。就像軟件工程團隊一樣。

交付基于為組織帶來的價值。團隊并不是孤立地生活,也不是為了學習而只是在遙遠的舒適繭中學習。他們交付。他們解決問題。

解決問題有助于他們帶來業(yè)務(wù)價值。像敏捷團隊一樣。她的團隊工作敏捷。也可以實現(xiàn)兩周的Sprint。

像在軟件產(chǎn)品組織中一樣,她的團隊經(jīng)歷了建立MVP(最小可行產(chǎn)品)的過程。那是她的客戶可以接管的地方。

結(jié)論

 

 

每個利益相關(guān)者都有一個角色?茖W家可以定義愿景,構(gòu)思構(gòu)想,找到正確的算法。然后,工程師可以將其“帶回家”,并將其轉(zhuǎn)換為工具箱或平臺中的生產(chǎn)代碼。最后,應(yīng)用程序開發(fā)人員可以結(jié)合現(xiàn)已在平臺上工業(yè)化的科學技術(shù),以構(gòu)建出色的產(chǎn)品。這就是我所說的數(shù)據(jù)科學的工業(yè)化。

經(jīng)過這些經(jīng)驗,并能夠與其他人面對一些想法和部分經(jīng)驗,這是我的結(jié)論(到目前為止):

♦ 數(shù)據(jù)科學團隊與軟件工程團隊沒有太大區(qū)別。

♦ 期望有所不同,因為其中的實驗部分更為重要。

♦ 可以應(yīng)用標準軟件方法(Agile, SAFe…),但在研究方面更具挑戰(zhàn)性。

♦ 隨著TDD成為標準,測試驅(qū)動數(shù)據(jù)科學還不存在。

♦ 存在諸如偏見之類的新挑戰(zhàn),但這難道不是QA的一部分嗎?

♦ 模型的治理也是前所未有的挑戰(zhàn)。

標簽: 數(shù)據(jù) 蒲哦

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:60多個有用的數(shù)據(jù)可視化圖形庫

下一篇:數(shù)據(jù)科學的專業(yè)認證越來越重要