中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

尷尬了,數(shù)據(jù)故事講不好,模型再酷炫都沒用

2018-08-06    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

導言:數(shù)據(jù)科學風靡了幾年,已經(jīng)完成了從普及到應用的商業(yè)落地,越來越多的公司都已經(jīng)同意數(shù)據(jù)驅(qū)動戰(zhàn)略的重要性,但雇幾個數(shù)據(jù)科學家和有一個數(shù)據(jù)團隊,并不等同于公司就能坐享數(shù)據(jù)科學的果實。

數(shù)據(jù)科學家慢慢發(fā)現(xiàn)在科研階段引以為豪的高端模型,在向沒有技術(shù)背景的管理層做展示的時候毫無吸引力,得出的商業(yè)建議在付諸實施的時候也大打折扣。

作者認為要想做一個有影響力的數(shù)據(jù)科學家首先得學會講好故事,他給出了三個有效建議來幫數(shù)據(jù)科學家提高從洞察到行動的轉(zhuǎn)換率。

有兩類數(shù)據(jù)科學家:一類科學家專注于數(shù)據(jù)分析(A類),另一類專注于模型構(gòu)建(B類)。

在數(shù)據(jù)科學項目中,兩種科學家可能出現(xiàn)如下兩種問題:

• 模型不適用于應用體系。

• 洞察的結(jié)果對于改進產(chǎn)品沒有用處。

這兩種結(jié)果常發(fā)生在從數(shù)據(jù)科學到其他領(lǐng)域的過渡之中:一種是從數(shù)據(jù)科學到軟件工程,另一種是從數(shù)據(jù)科學到業(yè)務執(zhí)行。

這兩種轉(zhuǎn)變是對現(xiàn)實生活創(chuàng)造價值和產(chǎn)生影響的關(guān)鍵,因此這個過程也存在很高的風險。

在模型交付過程中,軟件工程師可能會說這些模型不符合他們的工程標準,商業(yè)部門的同事可能會說你的想法很有趣,但他們不會有所行動。這些這樣那樣的“借口”經(jīng)常會丟給數(shù)據(jù)科學家們讓他們很難取得成績。這比數(shù)據(jù)科學領(lǐng)域其他挑戰(zhàn)更令人擔憂,因為我們無法左右數(shù)據(jù)分析成果在被轉(zhuǎn)交后的命運。

盡管我們能做的非常有限,但我們應該采取一些行動來避免這兩種結(jié)果。

模型部署在不同的機構(gòu)中會有不同的效果,但是編寫應用級代碼可以幫助數(shù)據(jù)科學家進行更好的部署。

Trey Causey在他的博客中為數(shù)據(jù)科學家列出了編寫應用級代碼”所要做的一些事”

網(wǎng)址:http://treycausey.com/software_dev_skills.html

簡而言之就是,使代碼模塊化,創(chuàng)建文檔,使用版本控制(包含但不限于詳細記錄和建立測試)。

許多數(shù)據(jù)科學家習慣使用自上而下的命令式編碼; 這種風格對與軟件工程師合作制造了障礙。要使部署工作順利進行,編寫應用級代碼很重要。

將想法轉(zhuǎn)換為實際行動就像將“思維代碼”部署到“社會機器”中一樣。

如果數(shù)據(jù)科學家可以通過編寫應用級代碼來改進模型部署,那么數(shù)據(jù)科學家可以做些什么來改進商業(yè)戰(zhàn)略落實呢?

用數(shù)據(jù)講故事的能力是解決問題的關(guān)鍵。

數(shù)據(jù)背后引人入勝的故事可以給觀眾留下深刻印象并激勵大家的行動力。用數(shù)據(jù)講故事聽起來很棒,但“講故事”本身卻是一個模糊的概念。為了真正深入了解數(shù)據(jù)故事,最近我回顧了Cole Knaflic撰寫的《Storytelling with Data》和Nathan Yau編寫的《Visualization that Means Something》。這兩本書讓我重新認識了用數(shù)據(jù)說話(講故事)。

基于這兩本書和我的經(jīng)驗,我想向你介紹優(yōu)化結(jié)論向行動轉(zhuǎn)換的策略。

概述:

• 一開始就將想法觀點亮出來

• 在視覺層次上強調(diào)你的突破性結(jié)論

• 提升結(jié)論到行動的轉(zhuǎn)化率

把觀點性結(jié)論放在展示最開始的部分

幾個月前,我學會了一種呈現(xiàn)數(shù)據(jù)科學結(jié)果的方法。我認為這種方法很有效,我看到很多科學論文都采用了這種方法。

所以我的展示流程是,我從背景開始,討論數(shù)據(jù)源,使用圖形和表格來突出數(shù)據(jù)屬性,討論模型構(gòu)建,討論建模結(jié)果,最后總結(jié)觀點(適當時要求采取行動)。

在這個流程中,想法見解是放在最后的,因為對數(shù)據(jù)和模型的基本解釋會讓觀眾真正理解觀點做適當鋪墊。

這個流程對我很有用,然而對于我的商業(yè)合作伙伴卻不是這樣——這些合作伙伴是商業(yè)實操的資深人士,但卻是數(shù)據(jù)科學領(lǐng)域的門外漢(如今大多數(shù)決策者還是沒有受過數(shù)據(jù)科學的專業(yè)培訓)。

他們對我的數(shù)據(jù)探索過程不好奇,對建模細節(jié)也不感興趣。他們只對這些見解感興趣,因此建議我將數(shù)據(jù)細節(jié)移到附錄中。

盡管我驚訝于他們對科學推理過程的不重視,但在我采納他們的建議后,發(fā)現(xiàn)我的數(shù)據(jù)講故事能夠更快地與他們產(chǎn)生共鳴。

看來隱去數(shù)理推理過程的確更受歡迎。

為了做得更好,我回過頭重新審視那些與我觀點不直接相關(guān)的內(nèi)容,F(xiàn)在,我講的故事更多地圍繞著結(jié)論而不是數(shù)據(jù)建模建立的過程。

喬什·伯諾夫(Josh Bernoff)在《Writing Without Bullshit》這本書中的一段很好地概括了上述的這種現(xiàn)象:

你必須顛倒你在學校學到的關(guān)于推理和寫作的知識。在學校里,你學會先熱身,再從第一原理開始慢慢推導出結(jié)論。但商業(yè)背景的讀者沒有熱身時間,對推理過程缺乏耐心,除非他們提前知道目的是什么,回報是什么。所以從鮮明的觀點陳述和結(jié)論開始,然后配上你的依據(jù)和理由。這樣,讀者不必閱讀整篇文檔就可以有所收獲。

我仍然和我的技術(shù)同事用行話交流,然而,打交道的決策層次越高,我就越需要像Josh所說的那樣先說結(jié)論再說依據(jù)。

另一個職業(yè)——咨詢顧問,一直以來支撐著企業(yè)高管作出決策。

好像咨詢顧問早就意識到需要先把觀點擺在前面的重要性。

我找到了咨詢顧問寫的一篇關(guān)于家庭語音銀行的研究論文。

本文采用的流程就是久經(jīng)考驗的講故事方式。

 

 

來自咨詢公司的研究論文中的目錄

正如在上面的目錄中可以看到的,顧問在“執(zhí)行摘要”之后需立即提出“建議”,而將研究方法放在最后一個章節(jié)。

其中在一開始就有大膽的結(jié)論和建議,也包含了決策可能產(chǎn)生的后果。

在本文中,市場對智能語音銀行業(yè)務的需求很低,因此顧問建議銀行對此持謹慎態(tài)度。對于顧問而言這是是常見的方法。無論是寫作還是演講,在最顯眼的位置需要展示最重要的內(nèi)容。

為了實現(xiàn)見解與行動的轉(zhuǎn)化,應該把觀點放在最開始的地方。

在視覺層次上強調(diào)突出你的結(jié)論傾向

數(shù)據(jù)可視化效果直接決定數(shù)據(jù)故事的好壞。數(shù)據(jù)可視化有表格和圖形,包括視覺線索,坐標系統(tǒng),比例尺,周圍文本等形式。

數(shù)據(jù)可視化既是一種很好的信息交流方式,所謂“一圖勝千言”;同時也是一種很好的分析方式,正如John Tukey在《探索性數(shù)據(jù)分析(Exploratory Data Analysis)》中所說的“圖片的最大價值在于它使我們注意到我們之前從未注意過的東西”。

鑒于數(shù)據(jù)可視化的有用性,我們可以通過更好地使用數(shù)據(jù)可視化來顯著提高數(shù)據(jù)的“故事性”。

以前我的數(shù)據(jù)可視化優(yōu)化策略是把圖表做得更好看。我會瀏覽我起草的表格和圖表,選擇最有趣的表格,添加缺失的標題、圖例和顏色,最后將它們放入我的演示文稿中。

這種方法一直效果不錯,直到最近,當信息就呈現(xiàn)在我的同事面前,但他們還在問我信息在哪兒的時候。我這才意識到,我的圖表雖然展示了信息但并沒有傳達出該關(guān)注圖表哪個區(qū)域的信號。

在《Storytelling with Data and Visualization that Means Something》一書中,借助潛意識屬性來創(chuàng)建有層次的視覺結(jié)構(gòu)這一概念可以幫助我們體驗到數(shù)據(jù)可視化真正的力量。

數(shù)據(jù)可視化不僅僅是使用正確的格式展示數(shù)據(jù),更是用暗示性的視覺指示來引導觀眾更好地理解圖片給出的信息,在視覺結(jié)構(gòu)的最頂層給出觀點。

我將使用兩個案例進行說明。

以下是Cole Knaflic的案例研究。下面的第一張圖是典型的線性圖。線形圖多用于在時間序列上的研究、重復測量研究等。

下面的圖表有正確的標題、坐標軸和圖例。從技術(shù)標準來看這是一個還不錯的圖表。但是,讀者幾乎不知道它想說什么。

 

 

數(shù)據(jù)是由投資者提供的,百分比之和大于100是因為調(diào)查者可以作出多個選擇

改進之后的版本則是使用了潛意識屬性。下面的圖表中使用加粗的藍色折線突出了最大的增長趨勢,而其它所有的趨勢則是采用了灰色,使其和背景融為一體。經(jīng)由更好的視覺層次的結(jié)構(gòu),讀者可以更加輕松的理解這張數(shù)據(jù)可視化圖表。

 

 

在我采取這種方法之后,每當我采用前注意的特性來突出我想表達的內(nèi)容的時候,我可以立刻注意到觀眾的反饋來得更快,更加強烈而且更加積極。這證明了在視覺層次的強調(diào)的確有效果。

在另外一個案例研究中,Cole Knaflic闡述了標題的強大之處。在下面的圖表中,標題不是典型的“請求數(shù)量的時間趨勢圖”,這樣的標題是描述性的,但不夠直接。而這里給出的標題是“請批準雇傭兩名全職員工”,給出了一個明確可采取的措施。這個建議幫助讀者從趨勢線中找到了因為兩名員工的離職所導致的績效差距。

 

 

我總是使用描述性的標題:“X隨Y變化的趨勢”,“A隨B的分布”等等,F(xiàn)在我的標題是一個建議,問題或者真知灼見。標題是數(shù)據(jù)可視化中最重要的一個部分,一個充滿張力的標題將極大提升信息輸出效率。

我強烈推薦Cole和Nathan的圖書《Storytelling with Data: A Data Visualization Guide for Business Professionals》 ,書中還有很多其它的技巧會對你產(chǎn)生幫助。

鏈接:

http://flowingdata.com

http:/www.storytellingwithdata.com/

提高洞察到行動的轉(zhuǎn)化率

利用數(shù)據(jù)講故事不是一個一次性的展示。你會被要求一遍又一遍的對不同利益相關(guān)者講述同一個故事,特別是當你的真知灼見成功地與初始受眾產(chǎn)生共鳴的時候。整個過程就像一個路演,你可以利用你的數(shù)據(jù)故事來活得盡可能多的支持。

有了足夠多的支持之后,人們就會開始采取行動:利用不同的方式定位消費潛力,調(diào)整目前的戰(zhàn)略從而提高運營效率,關(guān)閉不必要的產(chǎn)品功能,推出新流程來防范風險等等。

正如中國的一句諺語:牽一發(fā)而動全身。把你得出的建議轉(zhuǎn)化為行動時,會對組織的各個部分產(chǎn)生連鎖反應,而每個部門自然會從多個方向進行審查,而這些審查對于你的分析來說相當于一次壓力測試。

本著一種懷疑的態(tài)度,人們可以對你的數(shù)據(jù)質(zhì)量,假設和建模方法提出質(zhì)疑。如果人們在你的原始數(shù)據(jù)中發(fā)現(xiàn)了錯誤,那么你故事的說服力會降低。

從不同的角度來看,人們可能會在你的關(guān)注點之外提出各種問題,這可能會導致額外的分析迭代過程。即使你基于數(shù)據(jù)的故事被別人完全接受,人們也可能會要求你提供數(shù)據(jù),圖表和數(shù)據(jù)模型從而進行進一步的分析。

人們還可能會要求你為了其它會議提供不同的圖表。這些需求將促使你將分析的工作文檔記錄在案,使其可訪問,模塊化和可交互。如果你通過了這些壓力測試并不斷改進你的故事,你的故事會變得更加精巧,并且與實際行動更加接近。

路演有可能會成功,失敗,或者介乎二者之間。A型數(shù)據(jù)科學家需要對預期和實際行動之間的轉(zhuǎn)化情況有合理的預估。時至今日,每個商業(yè)領(lǐng)袖都高度重視由數(shù)據(jù)驅(qū)動的決策,而給出數(shù)據(jù)解決方案成為商業(yè)世界中最重要的環(huán)節(jié)。

但是這種趨勢并不意味著決策僅僅將由數(shù)據(jù)驅(qū)動。決策本身仍然是科學與藝術(shù)的復雜調(diào)和,是數(shù)據(jù)邏輯和業(yè)務邏輯的混合體。在現(xiàn)實世界中,高管利用群策群力,定性和定量地來做出決策。

數(shù)據(jù)科學分析能夠完全決定一項主要商業(yè)活動這句話并沒有錯誤,但是也可能會起到誤導作用。在過去,我認為如果一個數(shù)據(jù)分析的結(jié)果最終導致一個商業(yè)行動,那么這個數(shù)據(jù)分析本身是成功的。但是我現(xiàn)在看到了更多的商業(yè)案例,在這些案例中我們獲得了一些真知灼見,但并沒有轉(zhuǎn)化為行動。

通過研究復雜的商業(yè)世界,我現(xiàn)在得出的結(jié)論是:將商業(yè)洞察轉(zhuǎn)化為行動還取決于你的洞察有多大的影響力。而且A型數(shù)據(jù)科學家的成功不應該由它們的分析所帶來的商業(yè)行動(和業(yè)務成果)來判斷。放下對于數(shù)據(jù)科學可以化腐朽為神奇的幻想,并且承認洞察力的實際局限性有助于讓我更好地專注打磨技巧,而不是被許多無法控制的事情分散注意力。

最后想說的話

商業(yè)洞察是數(shù)據(jù)科學工作的重要輸出。我們尋找數(shù)據(jù)洞察力,因為我們需要洞察力來幫助我們讓這個世界變得更美好。將洞察力轉(zhuǎn)化為行動是將有價值的洞察力變?yōu)楝F(xiàn)實的方式。

由于數(shù)據(jù)科學家通常會將分析結(jié)果交給其他專業(yè)人士作決策,數(shù)據(jù)科學家應該更好地講述數(shù)據(jù)背后的故事,從而能夠更好地將洞察力轉(zhuǎn)化為行動。通過把將商業(yè)建議放到演講最開始的部分,并且在視覺上著重強調(diào),數(shù)據(jù)科學家可以講述更加打動人的數(shù)據(jù)故事,從而保持一個合理的從洞察到行動的轉(zhuǎn)化率。

標簽: 代碼 數(shù)據(jù)分析

版權(quán)申明:本站文章部分自網(wǎng)絡,如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:工業(yè)數(shù)據(jù):黑客盯上的又一塊“肥肉”

下一篇:19個超贊的數(shù)據(jù)科學和機器學習工具(附資料)