中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

總結(jié):數(shù)據(jù)可視化基本套路

2018-08-06    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用
本文總結(jié)了多種數(shù)據(jù)可視化圖形,并簡(jiǎn)要介紹了各種圖形的作用,能為數(shù)據(jù)科研工作者在數(shù)據(jù)可視化階段提供新的思路,在此分享給大家。

原文如下 :

首先從維基百科上搬出數(shù)據(jù)可視化的概念:

• 數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)之視覺(jué)表現(xiàn)形式的研究;其中,這種數(shù)據(jù)的視覺(jué)表現(xiàn)形式被定義為一種以某種概要形式抽提出來(lái)的信息,包括相應(yīng)信息單位的各種屬性和變量。

用人話簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)可視化就是用圖形的方式來(lái)表征數(shù)據(jù)的規(guī)律。

首先要明確幾點(diǎn):

• 數(shù)據(jù)可視化從來(lái)只是表層的東西,數(shù)據(jù)分析才是核心。就像一個(gè)人,不一定長(zhǎng)得漂亮人格就高尚,也不一定長(zhǎng)得不好看人格就低下。而應(yīng)該反過(guò)來(lái),只只有數(shù)據(jù)分析內(nèi)涵豐富、價(jià)值高,數(shù)據(jù)可視化才能內(nèi)容豐富、有價(jià)值。

• 可是這是個(gè)看臉的世界,大部分人對(duì)于數(shù)據(jù)也都是外行的,只有把數(shù)據(jù)可視化做得漂亮才能吸引他們的注意;只有把數(shù)據(jù)可視化做得簡(jiǎn)單易懂,他們才能理解數(shù)據(jù)分析的內(nèi)涵。

• 對(duì)于數(shù)據(jù)可視化,最重要的東西從來(lái)不是圖形、工具、配色這些套路性的東西,而在于創(chuàng)意和靈感?赡阌植皇菂⒓颖荣,并不需要那么多的創(chuàng)意靈感。在日常工作中,還是以實(shí)用為主,所以掌握套路還是很必要的。

本文旨在總結(jié)數(shù)據(jù)可視化基本套路,理解了本文的內(nèi)容,就算不能在數(shù)據(jù)可視化比賽中拿獎(jiǎng),應(yīng)付日常工作應(yīng)該也夠了。熟悉了套路怎么看,再結(jié)合專業(yè)知識(shí),就可以解釋可視化結(jié)果了。

常用圖形

散點(diǎn)圖

 

 

散點(diǎn)圖用來(lái)表征兩個(gè)(如果多個(gè)就分面,如上圖)數(shù)值型變量間的關(guān)系,每個(gè)點(diǎn)的位置(即x軸和y軸坐標(biāo))映射著兩個(gè)變量的值。當(dāng)然對(duì)于三個(gè)數(shù)值型變量,也有三維散點(diǎn)圖,不過(guò)用得不多。

氣泡圖

 

在散點(diǎn)圖的基礎(chǔ)上加一個(gè)維度,把各個(gè)點(diǎn)的面積大小映射一個(gè)新的變量,這樣不僅點(diǎn)的位置還有大小表示數(shù)據(jù)特征。

折線圖

 

把散點(diǎn)圖各個(gè)散點(diǎn)用折線連接起來(lái)就成了折線圖,當(dāng)然不僅僅只是為了好看,當(dāng)散點(diǎn)越多,折線就越平滑地趨近于曲線,能更加貼切地反映連續(xù)型變量的規(guī)律。

面積圖

 

把折線圖進(jìn)一步往坐標(biāo)軸投影就成了面積圖,本質(zhì)其實(shí)跟折線圖沒(méi)區(qū)別,只是看起來(lái)更加飽滿一點(diǎn)。

柱狀圖

 

柱狀圖是一種用得很廣泛的圖形,它表征分類型變量 vs 數(shù)值型變量的關(guān)系。如果分類型變量的每一個(gè)取值還能繼續(xù)分類,那么簡(jiǎn)單的柱狀圖就變成了復(fù)雜的柱狀圖,每一個(gè)類別僅由一根柱變成多根柱,多根柱可以串列,也可以并列。

值得一提的是,柱狀圖一般需要排序:如果分類型變量是有序的,按照它本身的順序排列即可;如果分類型變量無(wú)序,那么則根據(jù)數(shù)值型變量的大小進(jìn)行排序,使柱狀圖的高度單調(diào)變化。(排序的宗旨是直觀的表達(dá)出想展示的規(guī)律)

條形圖

 

只不過(guò)把柱狀圖坐標(biāo)旋轉(zhuǎn)一下,豎著的變成橫著的,這個(gè)可根據(jù)版面自由選擇。上圖示例就是串列的堆疊條形圖。

南丁格爾玫瑰圖

 

本質(zhì)還是柱狀圖,只不過(guò)把直角坐標(biāo)系映射成極坐標(biāo)系。看起來(lái)比柱狀圖更美觀。

瀑布圖

 

瀑布圖是柱狀圖的一種延伸,它一般表示某個(gè)指標(biāo)隨時(shí)間的漲跌規(guī)律,每一個(gè)柱狀也不都是從0開(kāi)始的,而是從前一個(gè)柱狀的終點(diǎn)位置開(kāi)始,這樣既反映了每一個(gè)時(shí)刻的漲跌情況,也反映了數(shù)值指標(biāo)在每一個(gè)時(shí)刻的值。

餅圖

 

餅圖的本質(zhì)仍是柱狀圖,只不過(guò)餅圖一般用來(lái)表示各個(gè)類別的比例,而不是絕對(duì)的數(shù)值,用角度來(lái)映射大小。

值得一提的是,因?yàn)橐粋(gè)圓餅只有360度,如果類別太多了,這個(gè)餅會(huì)被切割得非常細(xì),不利于閱讀;這種情況下老老實(shí)實(shí)地用柱狀圖。

圓環(huán)圖

 

本質(zhì)就是餅圖,只不過(guò)把實(shí)心圓換成了空心的圓環(huán);如果清一色的餅圖太過(guò)單調(diào),可以考慮換個(gè)環(huán)形圖。

sunburst chart

 

sunburst chart看起來(lái)跟餅圖比較像,但比餅圖更復(fù)雜得多。它從中心向外輻射,每輻射一層就細(xì)分一層,用來(lái)表示多個(gè)變量多層之間的比例關(guān)系。

馬賽克圖

 

馬賽克圖比較復(fù)雜,與柱狀圖相比,它的分類變量就多了幾個(gè),而且還能實(shí)現(xiàn)交叉映射,所以比柱狀圖更抽象,更細(xì)化。

馬賽克圖隱含著大量的數(shù)據(jù)信息。例如:(1)從船員到頭等艙,存活率陡然提高;(2)大部分孩子都處在三等艙和二等艙中;(3)在頭等艙中的大部分女性都存活了下來(lái),而三等艙中僅有一半女性存活;(4)船員中女性很少,導(dǎo)致該組的Survived標(biāo)簽重疊(圖底部的No和Yes)。繼續(xù)觀察,你將發(fā)現(xiàn)更多有趣的信息。關(guān)注矩形的相對(duì)寬度和高度,你還能發(fā)現(xiàn)那晚其他什么秘密嗎?擴(kuò)展的馬賽克圖添加了顏色和陰影來(lái)表示擬合模型的殘差值。在本例中,藍(lán)色陰影表明,在假定生存率與船艙等級(jí)、性別和年齡層無(wú)關(guān)的條件下,該類別下的生存率通常超過(guò)預(yù)期值。紅色陰影則含義相反。一定要運(yùn)行該例子的代碼,這樣你可以真實(shí)感受下著色圖形的效果。圖形表明,在模型的獨(dú)立條件下,頭等艙女性存活數(shù)和男性船員死亡數(shù)超過(guò)模型預(yù)期值。如果存活數(shù)與船艙等級(jí)、性別和年齡層獨(dú)立,三等艙男性的存活數(shù)比模型預(yù)期值低。嘗試運(yùn)行example(mosaic),可以了解更多馬賽克圖的細(xì)節(jié)。

直方圖

 

直方圖看起來(lái)跟柱狀圖很像,但其實(shí)本質(zhì)并不一樣 (這一點(diǎn)需要注意)。直方圖用來(lái)表征一個(gè)數(shù)值型變量的分布,具體來(lái)說(shuō)就是把這個(gè)連續(xù)型變量劃分成多個(gè)區(qū)間,然后統(tǒng)計(jì)各個(gè)區(qū)間的頻數(shù)。直方圖橫軸是數(shù)值型變量本身的值,縱軸是頻數(shù)。

概率密度曲線圖

 

概率密度曲線圖本質(zhì)與直方圖類似,不過(guò)縱軸不是頻數(shù)而是頻率。正如折線圖和面積圖一樣,概率密度曲線圖也可自由選擇要不要面積投影。這個(gè)圖太學(xué)術(shù)了,一般出現(xiàn)在數(shù)學(xué)教材中(比如正態(tài)分布……)。

雷達(dá)圖

 

很多游戲中的人物能力極向?qū)Ρ染褪且岳走_(dá)圖表示的。柱狀圖一般是一個(gè)分類型變量不同類別間的比較,雷達(dá)圖可以是多個(gè)數(shù)值不在同一個(gè)scale之下;更具體地說(shuō),柱狀圖一般是橫向比較,雷達(dá)圖既可以多個(gè)觀測(cè)之間的縱向比較,也可以是一個(gè)觀測(cè)在不同變量間的橫向比較。

值得一提的是,雷達(dá)圖如果用來(lái)橫向比較,需先把各個(gè)數(shù)值變量作歸一化處理。

標(biāo)簽: b2c 代碼 數(shù)據(jù)分析

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:降溫!降溫!降溫!四家數(shù)據(jù)中心創(chuàng)業(yè)公司的液

下一篇:你的公司到底需不需要數(shù)據(jù)科學(xué)家?