中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

現(xiàn)代數(shù)據(jù)科學家的“忍者“技能

2020-12-04    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

作者:Khush Patel 譯者:劉志勇 來源:InfoQ

突然間,數(shù)據(jù)科學家成了“香餑餑”。江湖傳言,剛畢業(yè)的人工智能博士起薪 50 萬,2 年經(jīng)驗的薪水 100 萬以上,貌似一當上數(shù)據(jù)科學家,分分鐘就能實現(xiàn)財富自由……屏幕前的你,是不是躍躍欲試?如果你想成為一名數(shù)據(jù)科學家,那么本文將會給你介紹真正的數(shù)據(jù)科學家必需的所有技能。

用外行人的話來說,火箭專家就是一個具有火箭科學知識(并在火箭科學方面具有驚人經(jīng)驗)的人。要成為一名數(shù)據(jù)科學家并不難。(我說的不難,并不是說每個小孩都可以擔任數(shù)據(jù)科學家。要知道,成為一名噴氣式飛行員并不需要掌握火箭科學方面的知識,但仍然也需要付出很多努力。)

 

 

在和 Linkedln 上的許多數(shù)據(jù)科學家進行交流之后,我寫下了這篇文章,收集了其他人 30 多年的經(jīng)驗。在本文中,你將會發(fā)現(xiàn)數(shù)據(jù)科學家很多令人驚嘆的經(jīng)歷。

讓我們來看看,如果要成為一名數(shù)據(jù)科學家,都必須掌握哪些所需的技能。

1. 數(shù)學與統(tǒng)計學

機器學習

各種機器學習技術的的知識,就好比任何數(shù)據(jù)科學家的“心臟”一樣。很難想象,會有這樣的數(shù)據(jù)科學家,居然沒有機器學習方面的知識。大多數(shù)公司要求機器學習工程師至少具備 3~5 年的基礎經(jīng)驗,之后,才有資格成為任何組織的數(shù)據(jù)科學家。

在人工智能項目中,機器學習工程師就是“萬事通”。萬事通意味著,對問題定義、數(shù)據(jù)分析、結果展示和測試都有透徹的理解。它包括了從預處理到選擇合適的算法來解決問題,再到以出色的可視化方式來展示結果的方方面面。整個過程都要靠你自己動手,因為你既是開發(fā)人員,又是分析人員,同時還是測試人員。

所以基本上,你需要擁有機器學習的“超能力”。

雖然你不必親自編寫每一行代碼,但是理解機器學習是很重要的。

統(tǒng)計建模

統(tǒng)計學在數(shù)據(jù)科學家的工作中起著非常重要的作用。僅僅是編寫機器學習算法的代碼這一項,你就必須對數(shù)據(jù)進行更多的分析。最后,經(jīng)過充分預處理的數(shù)據(jù)可能意味著你的項目已經(jīng)完成了一半。

你需要對評估矩陣,以及一些參數(shù),如正確率、錯誤率、精確度、召回率、F1 分數(shù)和其他術語有一個基本的理解,才能完成你的任務。對概率和統(tǒng)計有著超強理解的人可以像數(shù)據(jù)科學領域的國王一樣統(tǒng)治世界。

貝葉斯推斷

貝葉斯理論是數(shù)據(jù)分析領域中最重要的理論。數(shù)據(jù)革命始于貝葉斯理論。掌握貝葉斯理論的基礎知識,將會使你在數(shù)據(jù)科學競賽中所向披靡,勢如破竹。掌握這一理論,你才能夠輕松地從其他競爭對手中脫穎而出。

有監(jiān)督學習和無監(jiān)督學習

如果數(shù)據(jù)科學家沒有監(jiān)督算法知識,就好比沒有球的足球運動員。試想,如果一場足球賽中,球員在沒有球的情況下進行比賽,會是什么樣子?兩個字:愚蠢。同理,如果數(shù)據(jù)科學家沒有掌握有監(jiān)督算法和無監(jiān)督算法的知識,也是一樣的情景。

 

現(xiàn)代數(shù)據(jù)科學家的“忍者“技能

 

有監(jiān)督算法包括線性回歸、邏輯回歸、樸素貝葉斯線性判別分析、決策樹、K- 最近鄰算法、支持向量機、神經(jīng)網(wǎng)絡(多層感知器)等。

無監(jiān)督算法包括層次聚類、K- 均值、混合模型、 DBSCAN、OPTICS 算法、主成分分析等等。

優(yōu)化

優(yōu)化是一項不為多數(shù)人所能掌握的技能。這是使你有別于其他開發(fā)人員的關鍵因素。訓練模型并不很重要,但是,創(chuàng)建一個優(yōu)化版本的模型需要進行大量的工作。超參數(shù)每天都會讓你頭疼,如果你對優(yōu)化有著完美的理解,對你來說,優(yōu)化就像進行一場沒有任何障礙的比賽。因此,要成為一名“英雄”,就要優(yōu)化你的優(yōu)化技能。

2. 編程與數(shù)據(jù)庫

計算機科學基礎

計算機科學技能是很少有人能掌握的。但我有很多熟人,他們都是專業(yè)的機械工程師。他們開始學習 Python,然后轉(zhuǎn)入數(shù)據(jù)科學領域。你會驚訝的發(fā)現(xiàn),他們的表現(xiàn)就像冠軍一樣。

但是,計算機科學概念對數(shù)據(jù)科學家的角色來說,是非常重要的要求。如果你能夠掌握算法、操作系統(tǒng)、Web 開發(fā)和設計、計算機網(wǎng)絡的基礎知識將會帶來很大的不同。掌握這些概念,將會使你的速度提高十倍。

腳本和編程語言

如果沒有 Python、R 或 MatLab 這樣的腳本或編程語言,就不可能想象數(shù)據(jù)科學家的生活會是什么樣子的。如果你沒有掌握這些腳本或編程語言中的任何一個,那么就請你自己出局吧。沒有花花草草的話,你就永遠不會有一座花園。你能想象沒有花花草草的花園是什么樣子的嗎?試想一下,那不是花園,那是沙漠。而你必須在沙漠里耕作。這怎么可能呢?你不僅需要了解 Python,還需要了解一些更高級的庫,如 TensorFlow、PyTorch、帶 MatplotLib 的 Keras、Numpy 和 Pandas。

因此,在腳本和編程語言方面,沒有妥協(xié)的地方。就像 NO NO NO NO NO NO。就是這樣!

 

 

數(shù)據(jù)庫 SQL 和 NoSQL

每個項目都有自己的數(shù)據(jù)和存儲格式。全面了解各種數(shù)據(jù)庫,可以幫助你理解和定義項目特有的問題。

數(shù)據(jù)可以是任何形式的。你只需接受這些數(shù)據(jù)就可以了。你不能對客戶說,“不行,我想要不同格式的數(shù)據(jù)。”記住,你的職責就是將數(shù)據(jù)轉(zhuǎn)換成所需的算法輸入,并對其進行預處理。數(shù)據(jù)科學界指出,粗略的數(shù)據(jù)會降低正確性,但大量的非結構化數(shù)據(jù)會帶來意想不到的結果。但這需要創(chuàng)新的想法來解決。這時候,如果你掌握不同數(shù)據(jù)庫的知識,將有助于你解決問題。它可以是結構化的、非結構化的、圖像、文本、音頻或者其他東西。

將數(shù)據(jù)轉(zhuǎn)換為可視化

可視化是一件令人驚嘆的事情,你可以用數(shù)據(jù)來做。當你感受到可視化的重要性時,你就會從內(nèi)部感受到數(shù)據(jù)?梢暬钦故窘Y果的最佳方式。在演示中不用說一句話,你的老板就會明白一切。因此,它是數(shù)據(jù)科學領域取得成功的關鍵。

數(shù)據(jù)科學工具知識

不同工具的指令就像在比賽中使用特斯拉賽博皮卡一樣。當然,你也可以用“塔塔 Nano”(印度生產(chǎn)的全球最便宜的汽車)完成一場比賽,但是,這值得去完成一場比賽嗎?明智地使用任何工具也是一項技能。所有的工具都可以在互聯(lián)網(wǎng)上找到,但你必須能夠正確地使用它。

像 Tableau、SAS、Apache Spark、Excel、RapidMiner、KNIME、QlikView 這樣的工具,可以提高你的效率并縮短項目期限。

 

 

云計算

對云計算的了解并不是必須的,但可以作為一種資產(chǎn)。一些內(nèi)置的庫和服務可以很好地使用,比如,Google MLKit、Google Colaboratory、Kaggle 服務器、IBM Watson 和其他 API、Microsoft Azure AI 工具包和 AWS 存儲。

至此,全部技術細節(jié)我都講完了。

但是,你仍然對如何成為一名數(shù)據(jù)科學家一無所知。

3. 領域知識和軟技能

對業(yè)務充滿熱情

數(shù)據(jù)科學家也經(jīng)常從業(yè)務角度考慮問題,因為歸根結底,什么才是最重要的呢?錢。是的,我再說一次,錢!

你必須有很強的業(yè)務策略。它會提升你在組織中的價值,最重要的是你的名聲。作為數(shù)據(jù)科學家,有一個關于業(yè)務視角的想法是很好的。

對數(shù)據(jù)充滿好奇心

優(yōu)秀的數(shù)據(jù)科學家具備根據(jù)自己的經(jīng)驗以不同的方式看待數(shù)據(jù)的技能。數(shù)據(jù)科學家能看到的東西,初級工程師往往看不到,是因為數(shù)據(jù)科學家有經(jīng)驗的“放大鏡“和驚人的才能。所以,數(shù)據(jù)很能說明問題。作為一名數(shù)據(jù)科學家,你只需仔細聆聽。

問題解決能手

人工智能是沒有人能夠做到完美境界的領域。你可以面對很多挑戰(zhàn),只要你能夠跳出框框想問題即可。從字面上來看,解決問題就需要跳出框框來思考。你身邊有個解決方案,但你只需將它放入你的腦海中,它就會解決你的問題。

戰(zhàn)略決策者

作為一名數(shù)據(jù)科學家,在某些階段,你必須更上一層樓,因為,在完成某些任務后,你將會意識到,使用另一種技術,可以更輕松的完成這項任務。因此,要運用一些腦力和技巧來做決定。只需繼續(xù)使用基本的解決方案,然后再回來應用一些高級版本即可。

4. 溝通

與高級管理層接觸

這完全是關于人脈關系網(wǎng)、人際交往技巧和個人能力的問題。一分耕耘,一分收獲。這就像是你的數(shù)據(jù)科學職業(yè)競賽中的強力助推器。與機構接觸,他們會在組織需要的時候幫助你。與上級保持良好的溝通,可以讓你及時了解即將進行的項目。提前做好準備是最好的表現(xiàn)方式。

講故事的技巧

作為數(shù)據(jù)科學家,你必須參加很多會議,從董事會到客戶,再從首席技術官到許多其他人。因此,如果不給他們展示代碼的話,你就必須給他們解釋一個場景。因此,只要展示你的魔力,人們就會認為你是天使。只要把故事講好,你就可以睡個好覺了。

了解人工智能的最新趨勢

要隨時了解市場上的最新趨勢和技術。這會讓你成為一個積極的領導者。在這個技術時代(21 世紀),只有積極的領導者才能統(tǒng)治世界。

如果你擁有這些技能,那么你就是這個競賽的冠軍。這可是神一般的水平啊!

 

 

作者介紹:

Khush Patel,人工智能愛好者,機器學習工程師,F(xiàn)acebook 人工智能學者、發(fā)明家。

原文鏈接:

https://towardsdatascience.com/ninja-skills-of-modern-data-scientist-621622e59614


標簽: 數(shù)據(jù) 蒲Ъ

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:在時間關系數(shù)據(jù)上AutoML:一個新的前沿

下一篇:一文盤點2019年AI領域都發(fā)生了什么