2019 年關(guān)于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和人工智能的五大預(yù)測(cè)

2019-01-30 來源：raincent

容器云強(qiáng)勢(shì)上線！快速搭建集群，上萬Linux鏡像隨意使用

每年的這個(gè)時(shí)候，我們都會(huì)回顧過去，展望未來。對(duì)于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和人工智能來說，則是看看什么趨勢(shì)會(huì)加快、什么事情會(huì)真正發(fā)生、什么事情在未來一年不會(huì)發(fā)生。

我們一整年都在觀察和報(bào)道這些趨勢(shì)，并且我們搜索了網(wǎng)絡(luò)，咨詢了我們的一些專家以了解其他人的想法。

以下是我們對(duì)去年預(yù)測(cè)的快速回顧。

我們?cè)A(yù)測(cè)：模型制作和數(shù)據(jù)準(zhǔn)備都將變得越來越自動(dòng)化。更大的數(shù)據(jù)科學(xué)操作將匯集到單個(gè)平臺(tái)上(有很多可用的平臺(tái))。這兩個(gè)趨勢(shì)都是對(duì)追求效率和效益的響應(yīng)。簡(jiǎn)而言之，就是少數(shù)幾名數(shù)據(jù)科學(xué)家可以做許多科學(xué)家的工作。

預(yù)測(cè)正確。無代碼數(shù)據(jù)科學(xué)正在崛起，高級(jí)分析平臺(tái)中端到端的集成也是如此。

我們?cè)A(yù)測(cè)：數(shù)據(jù)科學(xué)將越來越專業(yè)化，這意味著神話般的“全棧”數(shù)據(jù)科學(xué)家將消失。

預(yù)測(cè)正確。現(xiàn)在談?wù)摳嗟氖菙?shù)據(jù)工程師而非數(shù)據(jù)科學(xué)家。數(shù)據(jù)工程師是讓數(shù)據(jù)科學(xué)模型在現(xiàn)實(shí)世界中工作的那些人。

我們?cè)A(yù)測(cè)：非數(shù)據(jù)科學(xué)家將比數(shù)據(jù)科學(xué)家做更多相當(dāng)復(fù)雜的分析工作。

預(yù)測(cè)正確。數(shù)據(jù)可視化和可視化分析技術(shù)的流行，讓非數(shù)據(jù)科學(xué)家可以從復(fù)雜的數(shù)據(jù)科學(xué)工具中獲取更多價(jià)值。

我們?cè)A(yù)測(cè)：深度學(xué)習(xí)是復(fù)雜且艱難的。沒有很多數(shù)據(jù)科學(xué)家專長于此領(lǐng)域，這將阻礙人工智能的應(yīng)用，直到深度學(xué)習(xí)平臺(tái)明顯地得到簡(jiǎn)化和產(chǎn)品化。

微軟和谷歌都于 2018 年推出了自動(dòng)化深度學(xué)習(xí)平臺(tái)。這些平臺(tái)都是從遷移學(xué)習(xí)開始，但在向著全面 AutoDL 的方向發(fā)展。還有一些整合了 AutoDL 平臺(tái)的初創(chuàng)企業(yè)。今年早些時(shí)候，我們考察了具有全面 AutoML 和 AutoDL 平臺(tái)的OneClick.AI。Gartner 最近提名DimensionalMechanics為具有 AutoDL 平臺(tái)的“5 大酷公司”之一。

我們?cè)A(yù)測(cè)：盡管有炒作，但人工智能和深度學(xué)習(xí)在更廣闊市場(chǎng)的滲入比我們想象的更有限而且速度也更慢。

除了聊天機(jī)器人的出現(xiàn)，真正的人工智能在企業(yè)中的應(yīng)用是有限的。它們?cè)趯?shí)現(xiàn)的路上，但還未完成。我所見過的最全面的研究表明，只有 1/5 或 1/3 的大型企業(yè)在“大規(guī)模”地實(shí)施人工智能，這意味著他們?cè)趯?shí)施全場(chǎng)緊逼戰(zhàn)術(shù)，給對(duì)手以最大的壓力。在規(guī)模小一點(diǎn)的公司中，這樣的公司所占的比例要小得多。我們也不能真正確定它們是否意味著“真正的”人工智能。

我們?cè)A(yù)測(cè)：公眾(和政府)將會(huì)認(rèn)真看待人工智能對(duì)社交和隱私的影響，包括有意和無意的影響。

只要看看新聞和報(bào)道，那些頂級(jí)社交媒體的高管們被政府和歐盟召喚去參加聽證會(huì)。開始看起來像游街示眾。政府將開始監(jiān)管，如果不在聯(lián)邦政府層面，那么會(huì)更加混亂，每個(gè)州各行其是，如即將生效的加州隱私規(guī)定或澳洲的強(qiáng)制性反加密要求。

因此，我們?nèi)ツ甑?6 個(gè)預(yù)測(cè)都實(shí)現(xiàn)了。盡管去年的很多預(yù)測(cè)對(duì)明年來說也有效，但是，我們打算做得更具體些。

以下是我們對(duì) 2019 年的趨勢(shì)預(yù)測(cè)。

預(yù)測(cè) 1：數(shù)據(jù)變得比算法更重要

無論是在深度學(xué)習(xí)還是在經(jīng)典機(jī)器學(xué)習(xí)領(lǐng)域，我們已經(jīng)有 1 年多時(shí)間沒有取得任何重大突破。有一些漸進(jìn)的改進(jìn)，比如，利用時(shí)間卷積網(wǎng)絡(luò)(Temporal Convolutional Nets，簡(jiǎn)稱 TCN)而不是 RNN 來減少 NLP 中的延遲，但是沒有重大創(chuàng)新。性能最好的算法都是眾所周知的算法，或者利用自動(dòng)機(jī)器學(xué)習(xí)很容易發(fā)現(xiàn)。

隨著各個(gè)企業(yè)踏上數(shù)字化轉(zhuǎn)型之旅，擁有更多更好的數(shù)據(jù)是成功的關(guān)鍵，而我們正處于這樣的時(shí)期。實(shí)際上，這給向不同方向發(fā)展的數(shù)據(jù)相關(guān)的解決方案提供了競(jìng)爭(zhēng)機(jī)會(huì)。

一方面，獲取準(zhǔn)確標(biāo)記的圖像或文本訓(xùn)練數(shù)據(jù)仍然相當(dāng)昂貴和耗時(shí)。像 Figure Eight 這樣專注于標(biāo)記數(shù)據(jù)的公司正在推廣智能成本效益策略，如：主動(dòng)學(xué)習(xí)，它讓客戶決定標(biāo)記數(shù)據(jù)和模型準(zhǔn)確性之間的最佳權(quán)衡。這涉及添加人工標(biāo)記或機(jī)器標(biāo)記數(shù)據(jù)，然后重新訓(xùn)練，通過多次迭代以找到最佳權(quán)衡。

另一方面是對(duì)第三方數(shù)據(jù)的訪問。像 DymstData 這樣的服務(wù)公司已經(jīng)進(jìn)入了該領(lǐng)域，作為數(shù)百種附加數(shù)據(jù)的結(jié)算機(jī)構(gòu)。他們還承擔(dān)著保護(hù)敏感 PII 這個(gè)任務(wù)繁重的角色，其用戶能夠基于角色以訪問在金融和健康服務(wù)領(lǐng)域特別重要的敏感信息。

第三個(gè)方面是自動(dòng)跟蹤和記錄模型中所用的數(shù)據(jù)源。特別地，當(dāng)集成來自很多數(shù)據(jù)源并隨著時(shí)間而變化的流數(shù)據(jù)時(shí)，了解數(shù)據(jù)的來源以及如何使用數(shù)據(jù)，對(duì)準(zhǔn)確性和合規(guī)性都至關(guān)重要。Tibco 和其他一些分析平臺(tái)正在引入這個(gè)功能。

圍繞數(shù)據(jù)的服務(wù)產(chǎn)品今年今年有望大幅增長。

預(yù)測(cè) 2：隨著人工智能 / 機(jī)器學(xué)習(xí)從分析平臺(tái)轉(zhuǎn)移到特定于行業(yè)或流程的應(yīng)用程序，一切都將變得更容易。

縱觀人工智能 / 機(jī)器學(xué)習(xí)初創(chuàng)企業(yè)的世界，就能看出競(jìng)爭(zhēng)正在轉(zhuǎn)向特定于行業(yè)或流程的應(yīng)用程序。這些應(yīng)用程序或迷你平臺(tái)專注于解決行業(yè)中特定的業(yè)務(wù)問題，如市場(chǎng)營銷、B2B 銷售、醫(yī)療保健、金融科技以及其他大約十幾個(gè)已經(jīng)明確定義的領(lǐng)域。要想有一個(gè)快速地了解，請(qǐng)參考下圖(CB Insights 年度人工智能 100 家優(yōu)勝者)以及他們按行業(yè)或流程進(jìn)行分類的方式。

這些新的應(yīng)用程序?qū)Ｗ⒂谇度胧饺斯ぶ悄?/ 機(jī)器學(xué)習(xí)，因此，用戶所在的組織就不需要一大組內(nèi)部數(shù)據(jù)科學(xué)家的支持，并且可以依賴這些開發(fā)人員繼續(xù)提供更新和改進(jìn)。

有些人把這稱為人工智能 / 機(jī)器學(xué)習(xí)的商品化，但是，把它們稱為人工智能 / 機(jī)器學(xué)習(xí)的專業(yè)化更準(zhǔn)確。

如果你一直從事類似的工作，那么你可能還記得 90 年代后期從再造工程(Reengineering)到 ERP 的轉(zhuǎn)變，現(xiàn)在的情況和當(dāng)時(shí)非常相似。最初，再造工程要求企業(yè)用復(fù)雜的定制 IT 解決方案來改進(jìn)流程，因?yàn)楫?dāng)時(shí)不存在標(biāo)準(zhǔn)解決方案。這迅速促成了大型綜合性 ERP 興起，其中包括甲骨文、PeopleSoft、SAP 和其他一些公司，也為像 CRM 這樣的專業(yè)應(yīng)用程序打開了大門。我們的行業(yè)目前正在經(jīng)歷同樣的變化。

這些新供應(yīng)商都致力于在他們特定的利基市場(chǎng)提供廣泛的解決方案，但是最終會(huì)少于大而全的 ERP 規(guī)模的平臺(tái)�？纯催@些行業(yè)分類中開發(fā)商的整合浪潮吧。

還要注意在中小型企業(yè)中人工智能 / 機(jī)器學(xué)習(xí)采用的加速情況，這些企業(yè)不再必須擁有大型數(shù)據(jù)科學(xué)家團(tuán)隊(duì)，或者完全依賴定制開發(fā)的模型。

預(yù)測(cè) 3：數(shù)據(jù)工程師和數(shù)據(jù)分析師的興起

這個(gè)世界并沒有拋棄數(shù)據(jù)科學(xué)家。還遠(yuǎn)遠(yuǎn)沒有。但是，當(dāng)缺乏擁有某種技能的人才時(shí)，市場(chǎng)會(huì)用另外的方式來填補(bǔ)，以減輕由此帶來的痛苦。

其中一種方式是通過我們前面討論過的特定于行業(yè)和流程的智能應(yīng)用程序來解決問題，這些應(yīng)用程序不需要大量的內(nèi)部數(shù)據(jù)科學(xué)家。

第二個(gè)就是所有主流分析平臺(tái)正在做的事和快速涌現(xiàn)的數(shù)十個(gè)自動(dòng)機(jī)器學(xué)習(xí)(AML)平臺(tái)。那就是在數(shù)據(jù)科學(xué)中更有效率，也就是說，只需要較少的數(shù)據(jù)科學(xué)家就可以做很多工作。

由于模型的數(shù)量沒有減少，事實(shí)上是在增加，這就把工作負(fù)荷轉(zhuǎn)移到了數(shù)據(jù)工程師身上，他們主要做兩件事情。

首先，他們要能夠創(chuàng)建數(shù)據(jù)科學(xué)所需的基礎(chǔ)設(shè)施，如數(shù)據(jù)湖或 Spark 實(shí)例。

其次，他們拿到那些模型并在業(yè)務(wù)系統(tǒng)中實(shí)現(xiàn)它們，同時(shí)跟蹤準(zhǔn)確性并進(jìn)行模型更新。

有些數(shù)據(jù)工程師還負(fù)責(zé)數(shù)據(jù)操作，以提供干凈整潔并經(jīng)過預(yù)處理的數(shù)據(jù)流。

分析平臺(tái)的另一個(gè)演進(jìn)是可視化分析和數(shù)據(jù)可視化工具的增長。這些工具現(xiàn)在大多數(shù)和數(shù)據(jù)科學(xué)工具集完全集成到一起，并允許數(shù)據(jù)分析師和 LOB 經(jīng)理提取更多價(jià)值，甚至指導(dǎo)分析工作。它們不會(huì)取代數(shù)據(jù)科學(xué)家。它強(qiáng)化了團(tuán)隊(duì)方面正在形成的高級(jí)分析。

預(yù)測(cè) 4：神經(jīng)晶片：人工智能來到物聯(lián)網(wǎng)邊緣

有兩種不同的技術(shù)正在同時(shí)達(dá)到半成熟狀態(tài)，它們可以解決一個(gè)長期存在的問題。這個(gè)問題就是延遲問題。

考慮一下這個(gè)例子，當(dāng)你想用移動(dòng)設(shè)備自動(dòng)把文本或圖像中的外文翻譯成英語時(shí)，你的設(shè)備實(shí)際上是把這些信號(hào)發(fā)回到在云上運(yùn)行的應(yīng)用程序，翻譯工作是在那里進(jìn)行的，然后把譯文發(fā)送回你的設(shè)備。

谷歌和其他提供即時(shí)翻譯服務(wù)的公司已經(jīng)從 RNN 轉(zhuǎn)換到稱為時(shí)間卷積網(wǎng)絡(luò)的專用 CNN 結(jié)構(gòu)，原因是 RNN 不能很好地適應(yīng) MPP，但 CNN 可以。這種轉(zhuǎn)換減少了延遲，但是信號(hào)仍然需要完成整個(gè)往返。

解決該問題的兩種技術(shù)中的第 1 種是 5G 網(wǎng)絡(luò)。你可能知道 5G 速度更快，但其真正的優(yōu)點(diǎn)是其可以承載的流量密度。這真正打開了讓你生活中的一切在互聯(lián)網(wǎng)上傳播的大門。這其中有多少是值得的還有待于觀察。

第 2 種解決方案是引入更好的新型神經(jīng)晶片(又稱 spiking neural networks，脈沖神經(jīng)網(wǎng)絡(luò))。我們希望這些全新的神經(jīng)網(wǎng)絡(luò)架構(gòu)可以成為實(shí)現(xiàn)人工通用智能(Artificial General Intelligence，簡(jiǎn)稱 AGI)的途徑。這還有很長的路要走。但是，主要的芯片制造商和一些初創(chuàng)企業(yè)正在發(fā)布脈沖神經(jīng)晶片，專門針對(duì)芯片上 CNN 和 RNN 類模型進(jìn)行了優(yōu)化(沒有信號(hào)往返)。其中一些還為了獲得極低的能耗進(jìn)行了優(yōu)化。

這些功能放在一起，很適合把深度學(xué)習(xí)轉(zhuǎn)移到真正位于網(wǎng)絡(luò)邊緣的芯片上。借助這些新功能，物聯(lián)網(wǎng)和其他流數(shù)據(jù)應(yīng)用程序有望在今年開始爆發(fā)。

預(yù)測(cè) 5：不同的人工智能框架之間開始交互

現(xiàn)在，文本、語音、圖像和視頻模型正在成為主流，我們碰到了意想不到的障礙。在一個(gè)框架(Caffe2、PyTorch、Apache MXNet、微軟 Cognitive Toolkit 和 TensorFlow)上構(gòu)建的模型無法輕松地移植到不同的框架。我們可以翻譯語音，但我們用的是名副其實(shí)的巴別塔。

幸運(yùn)的是，這樣的痛點(diǎn)推動(dòng)了創(chuàng)新。AWS、臉書和微軟合作構(gòu)建了開放式神經(jīng)網(wǎng)絡(luò)交換(Open Neural Network Exchange，簡(jiǎn)稱 ONNX)，使模型可在不同的框架上互操作。

隨著在開發(fā)人員、應(yīng)用程序和設(shè)備之間共享的模型的數(shù)量變得越來越多，ONNX 正在成為未來一年的關(guān)鍵技術(shù)。

這就是今年的情況。請(qǐng)繼續(xù)關(guān)注我們，明年來看看我們今年的預(yù)測(cè)準(zhǔn)不準(zhǔn)。

作者簡(jiǎn)介

Bill 是 Data Science Central 的編輯總監(jiān)。他還是 Data-Magnum 的總裁兼首席數(shù)據(jù)科學(xué)家。自 2001 年以來，他一直從事數(shù)據(jù)科學(xué)家的工作。請(qǐng)通過 Bill@DataScienceCentral.com 或 Bill@Data-Magnum.com 和他聯(lián)系。

閱讀英文原文：5 Predictions about Data Science, Machine Learning, and AI for 2019，https://www.datasciencecentral.com/profiles/blogs/5-predictions-about-data-science-machine-learning-and-ai-for-2019

標(biāo)簽： b2b 代碼谷歌互聯(lián)網(wǎng) 金融媒體數(shù)據(jù)分析搜索推廣網(wǎng)絡(luò) 轉(zhuǎn)型

版權(quán)申明：本站文章部分自網(wǎng)絡(luò)，如有侵權(quán)，請(qǐng)聯(lián)系：west999com@outlook.com
特別注意：本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)！
本站所提供的圖片等素材，版權(quán)歸原作者所有，如需使用，請(qǐng)與原作者聯(lián)系。

上一篇:pandas指南：做更高效的數(shù)據(jù)科學(xué)家

下一篇:機(jī)器學(xué)習(xí)數(shù)據(jù)集哪里找：最佳數(shù)據(jù)集來源盤點(diǎn)

相關(guān)文章

最新資訊

熱門推薦

為學(xué)習(xí)和知識(shí)分享目的，本站文章部分自網(wǎng)絡(luò)，本站文章部分自網(wǎng)絡(luò)，如有侵權(quán)，請(qǐng)聯(lián)系：2653426586@qq.com QQ：2653426586

如有其他需求，請(qǐng)聯(lián)系：2653426586@qq.com QQ：2653426586

友情鏈接：網(wǎng)絡(luò)安全運(yùn)維經(jīng)驗(yàn) IT技術(shù)分享運(yùn)維隨筆錄鮮花東郊到家往約到家

中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

2019 年關(guān)于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和人工智能的五大預(yù)測(cè)

2019 年關(guān)于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和人工智能的五大預(yù)測(cè)