中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

電競大數(shù)據(jù)平臺 FunData 的系統(tǒng)架構演進

2018-06-23    來源:

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

電競大數(shù)據(jù)時代,數(shù)據(jù)對比賽的觀賞性和專業(yè)性都起到了至關重要的作用。同樣的,這也對電競數(shù)據(jù)的豐富性與實時性提出了越來越高的要求。

 

 

電競數(shù)據(jù)的豐富性從受眾角度來看,可分為賽事、戰(zhàn)隊和玩家數(shù)據(jù);從游戲角度來看,維度可由英雄、戰(zhàn)斗、道具以及技能等組成;電競數(shù)據(jù)的實時性包括賽前兩支戰(zhàn)隊的歷史交戰(zhàn)記錄、賽中的實時比分、勝率預測、賽后比賽分析和英雄對比等。

因此多維度的數(shù)據(jù)支持,TB到PB級別的海量數(shù)據(jù)存儲與實時分析都對底層系統(tǒng)的架構設計有著更高的要求,亦帶來了更嚴峻的挑戰(zhàn)。

本文將介紹電競數(shù)據(jù)平臺FunData架構演進中的設計思路及相關技術,包括大數(shù)據(jù)流處理方案、結構化存儲轉非結構化存儲方案和數(shù)據(jù)API服務設計等。在其v1.0 beta版本中,F(xiàn)unData為頂級MOBA類游戲DOTA2(由Valve公司出品)提供了相關的數(shù)據(jù)接口。

1.0架構

項目發(fā)展初期,依照MVP理論(最小化可行產(chǎn)品),我們迅速推出FunData的第一版系統(tǒng)(架構圖如圖1)。系統(tǒng)主要有兩個模塊:Master與Slave。

 

 

圖1 1.0ETL架構圖

Master模塊功能如下:

• 定時調(diào)用Steam接口獲取比賽ID與基礎信息;

• 通過In-Memory的消息隊列分發(fā)比賽分析任務到Slave節(jié)點;

• 記錄比賽分析進度,并探測各Slave節(jié)點狀態(tài)。

Slave模塊功能如下:

• 監(jiān)聽隊列消息并獲取任務,任務主要為錄像分析,錄像分析參考GitHub項目Clarity與Manta;

• 分析數(shù)據(jù)入庫。

系統(tǒng)上線初期運行相對穩(wěn)定,各維度的數(shù)據(jù)都可快速拉取。然而隨著數(shù)據(jù)量的增多,數(shù)據(jù)與系統(tǒng)的可維護性問題卻日益突出:

• 新增數(shù)據(jù)字段需要重新構建DB索引,數(shù)據(jù)表行數(shù)過億構建時間太長且造成長時間鎖表;

• 系統(tǒng)耦合度高,不易于維護,Master節(jié)點的更新重啟后,Slave無重連機制需要全部重啟;同時In-Memory消息隊列有丟消息的風險;

• 系統(tǒng)可擴展性低,Slave節(jié)點擴容時需要頻繁的制作虛擬機鏡像,配置無統(tǒng)一管理,維護成本高;

• DB為主從模式且存儲空間有限,導致數(shù)據(jù)API層需要定制邏輯來分庫讀取數(shù)據(jù)做聚合分析;

• 節(jié)點粒度大,Slave可能承載的多個分析任務,故障時影響面大。

在開始2.0架構設計與改造前,我們嘗試使用冷存儲方法,通過遷移數(shù)據(jù)的方式來減輕系統(tǒng)壓力(架構設計如圖2)。由于數(shù)據(jù)表數(shù)據(jù)量太大,并發(fā)多個數(shù)據(jù)遷移任務需要大量時間,清理數(shù)據(jù)的過程同樣會觸發(fā)重新構建索引,方案的上線并沒有根本性地解決問題。

 

 

圖2 冷存儲方案

2.0架構

吸取1.0系統(tǒng)的經(jīng)驗,在2.0架構設計(架構圖如圖3)中,我們從維護性、擴展性和穩(wěn)定性三個方面來考慮新數(shù)據(jù)系統(tǒng)架構應該具備的基本特性:

• 數(shù)據(jù)處理任務粒度細化,且支持高并發(fā)處理(全球一天DOTA2比賽的場次在120萬場,錄像分析相對耗時,串行處理會導致任務堆積嚴重);

• 數(shù)據(jù)分布式存儲;

• 系統(tǒng)解耦,各節(jié)點可優(yōu)雅重啟與更新。

 

 

圖3 2.0ETL總架構圖

2.0系統(tǒng)選擇Google Cloud Platform來構建整個數(shù)據(jù)ETL系統(tǒng),利用PubSub(類似Kafka)作為消息總線,任務被細化成多個Topic進行監(jiān)聽,由不同的Worker進行處理。這樣一方面減少了不同任務的耦合度,防止一個任務處理異常導致其他任務中斷;另一方面,任務基于消息總線傳遞,不同的數(shù)據(jù)任務擴展性變得更好,性能不足時可快速橫向擴展。

任務粒度細化

從任務粒度上看(如圖3),數(shù)據(jù)處理分為基礎數(shù)據(jù)處理與高階數(shù)據(jù)處理兩部分;A數(shù)據(jù),即比賽的詳情信息(KDA、傷害與補刀等數(shù)據(jù))和錄像分析數(shù)據(jù)(Roshan擊殺數(shù)據(jù)、傷害類型與英雄分路熱力圖等數(shù)據(jù))由Supervisor獲取Steam數(shù)據(jù)觸發(fā),經(jīng)過worker的清理后存入Google Bigtable;高階數(shù)據(jù),即多維度的統(tǒng)計數(shù)據(jù)(如英雄、道具和團戰(zhàn)等數(shù)據(jù)),在錄像分析后觸發(fā),并通過GCP的Dataflow和自建的分析節(jié)點(worker)聚合,最終存入MongoDB與Google Bigtable。

從Leauge-ETL的細化架構看(如圖4),原有的單個Slave節(jié)點被拆分成4個子模塊,分別是聯(lián)賽數(shù)據(jù)分析模塊、聯(lián)賽錄像分析模塊、分析/挖掘數(shù)據(jù)DB代理模塊和聯(lián)賽分析監(jiān)控模塊。

• 聯(lián)賽數(shù)據(jù)分析模塊負責錄像文件的拉取(Salt、Meta文件與Replay文件的獲取)與比賽基本數(shù)據(jù)分析;

• 聯(lián)賽錄像分析模塊負責比賽錄像解析并將分析后數(shù)據(jù)推送至PubSub;

• 分析/挖掘數(shù)據(jù)DB代理負責接收錄像分析數(shù)據(jù)并批量寫入Bigtable;

• 聯(lián)賽分析監(jiān)控模塊負責監(jiān)控各任務進度情況并實時告警。

同時所有的模塊選擇Golang重構,利用其“天生”的并發(fā)能力,提高整個系統(tǒng)數(shù)據(jù)挖掘和數(shù)據(jù)處理的性能。

 

 

圖4 League-ETL架構

分布式存儲

如上文提到,1.0架構中我們使用MySQL存儲大量比賽數(shù)據(jù)及錄像分析數(shù)據(jù)。MySQL在大數(shù)據(jù)高并發(fā)的場景下,整體應用的開發(fā)變得越來越復雜,如無法支持schema經(jīng)常變化,架構設計上需要合理地考慮分庫分表的時機,子庫的數(shù)據(jù)到一定量級時面臨的擴展性問題。

參考Google的Bigtable,作為一種分布式的、可伸縮的大數(shù)據(jù)存儲系統(tǒng),Bigtable與HBase能很好的支持數(shù)據(jù)隨機與實時讀寫訪問,更適合FunData數(shù)據(jù)系統(tǒng)的數(shù)據(jù)量級和復雜度。

 

 

 

 

圖5 Hadoop生態(tài)

在數(shù)據(jù)模型上,Bigtable與HBase通過RowKey、列簇列名及時間戳來定位一塊數(shù)據(jù)(Cell,如圖6)。

 

 

圖6 數(shù)據(jù)索引

例如,在FunData數(shù)據(jù)系統(tǒng)中,比賽數(shù)據(jù)的RowKey以hash_key+match_id的方式構建,因為DOTA2的match_id是順序增大的(數(shù)值自增量不唯一),每個match_id前加入一致性哈希算法算出的hash_key,可以防止在分布式存儲中出現(xiàn)單機熱點的問題,提升整個存儲系統(tǒng)的數(shù)據(jù)負載均衡能力,做到更好的分片(Sharding),保障后續(xù)DataNode的擴展性。

如圖7,我們在hash環(huán)上先預設多個key值作為RowKey的前綴,當獲取到match_id時,通過一致性哈希算法得到match_id對應在hash環(huán)節(jié)點的key值,最后通過key值與match_id拼接構建RowKey。

 

 

 

 

圖7 一致性hash構建RowKey

時間戳的使用方便我們在聚合數(shù)據(jù)時對同一個RowKey和Column的數(shù)據(jù)重復寫入,HBase/Bigtable內(nèi)部有自定的GC策略,對于過期的時間戳數(shù)據(jù)會做清理,讀取時取最新時間節(jié)點的數(shù)據(jù)即可。

這里大家可能會有個疑問,Bigtable與HBase只能做一級索引,RowKey加上hash_key之后,是無法使用row_range的方式批量讀或者根據(jù)時間為維度進行批量查詢的。在使用Bigtable與HBase的過程中,二級索引需要業(yè)務上自定義。在實際場景里,我們的worker在處理每個比賽數(shù)據(jù)時,同時會對時間戳-RowKey構建一次索引并存入MySQL,當需要基于時間批量查詢時,先查詢索引表拉取RowKey的列表,再獲取對應的數(shù)據(jù)列表。

在數(shù)據(jù)讀寫上,Bigtable/HBase與MySQL也有很大的不同。一般MySQL使用查詢緩存,Schema更新時緩存會失效,另外查詢緩存是依賴全局鎖保護,緩存大量數(shù)據(jù)時,如果查詢緩存失效,會導致表鎖死。

如圖8,以HBase為例,讀取數(shù)據(jù)時,client先通過zookeeper定位到RowKey所在的RegionServer,讀取請求達到RegionServer后,由RegionServer來組織Scan的操作并最終歸并查詢結果返回數(shù)據(jù)。因為一次查詢操作可能包括多個RegionServer和多個Region,數(shù)據(jù)的查找是并發(fā)執(zhí)行的且HBase的LRUBlockCache,數(shù)據(jù)的查詢不會出現(xiàn)全部鎖死的情況。

 

 

圖8 HBase架構

基于新的存儲架構,我們的數(shù)據(jù)維度從單局比賽擴展到了玩家、英雄、聯(lián)賽等,如圖9。

 

 

 

 

圖9 數(shù)據(jù)維度

系統(tǒng)解耦

上文我們提到1.0架構中使用In-Memory的消息隊列做數(shù)據(jù)傳遞,由于內(nèi)存中隊列數(shù)據(jù)沒有持久化存儲并與Master模塊強耦合,Master節(jié)點更新或者異常Panic后會導致數(shù)據(jù)丟失,且恢復時間冗長。因此,在2.0架構中采用了第三方的消息隊列作為消息總線,保障系統(tǒng)“上下游”節(jié)點解耦,可多次迭代更新,歷史消息變得可追蹤,基于云平臺消息堆積也變得可視化(如圖10)。

 

 

圖10 數(shù)據(jù)監(jiān)控

數(shù)據(jù)API層

1.0系統(tǒng)的數(shù)據(jù)API層為實現(xiàn)快速上線,在架構上未做太多的設計與優(yōu)化,采用域名的方式實現(xiàn)負載均衡,并使用開源的DreamFactory搭建的ORM層,利用其RESTful的接口做數(shù)據(jù)訪問。

該架構在開發(fā)和使用過程中遇到許多問題:

• API層部署在國內(nèi)阿里云上,數(shù)據(jù)訪問需要跨洋;

• ORM層提供的API獲取表的全字段數(shù)據(jù),數(shù)據(jù)粒度大;

• 無緩存,應對大流量場景(如17年震中杯與ESL)經(jīng)常出現(xiàn)服務不可用;

• 多DB的數(shù)據(jù)聚合放在了API層,性能不足;

• 服務更新維護成本高,每次更新需要從域名中先剔除機器。

針對上述問題,我們從兩個方面重構了1.0數(shù)據(jù)API層,如圖11。

 

 

圖11 數(shù)據(jù)API新架構

鏈路的穩(wěn)定性

全球鏈路上,我們使用CDN動態(tài)加速保證訪問的穩(wěn)定性。同時利用多云廠商CDN做備份容災,做到秒級切換。

在調(diào)度能力和恢復能力上,我們搭建了自己的灰度系統(tǒng),將不同維度的數(shù)據(jù)請求調(diào)度到不同的數(shù)據(jù)API,減少不同維度數(shù)據(jù)請求量對系統(tǒng)的影響;借助灰度系統(tǒng),API服務更新的風險和異常時的影響面也被有效控制。依賴云平臺可用區(qū)的特性,灰度系統(tǒng)也能方便地實現(xiàn)后端API服務跨可用區(qū),做到物理架構上的容災。

另外,為保證內(nèi)部跨洋訪問鏈路的穩(wěn)定性,我們在阿里云的北美機房搭建數(shù)據(jù)代理層,利用海外專線來提升訪問速度。

數(shù)據(jù)高可用性

接入分布式存儲系統(tǒng)后,對外數(shù)據(jù)API層也根據(jù)擴展的數(shù)據(jù)維度進行拆分,由多個數(shù)據(jù)API對外提供服務,例如比賽數(shù)據(jù)和聯(lián)賽賽程等數(shù)據(jù)訪問量大,應該與英雄、個人及道具數(shù)據(jù)分開,防止比賽/賽事接口異常影響所有數(shù)據(jù)不可訪問。

針對熱點數(shù)據(jù),內(nèi)部Cache層會做定時寫入緩存的操作,數(shù)據(jù)的更新也會觸發(fā)Cache的重寫,保障賽事期間的數(shù)據(jù)可用。

結語

本文介紹了FunData數(shù)據(jù)平臺架構演進的過程,分析了舊系統(tǒng)在架構上的缺點,以及在新系統(tǒng)中通過什么技術和架構手段來解決。

FunData自4月10日上線以來,已有300多位技術開發(fā)者申請了API-KEY。目前也在著力于新數(shù)據(jù)點的快速迭代開發(fā),如聯(lián)賽統(tǒng)計數(shù)據(jù)。比賽實時數(shù)據(jù)等。

作者:肖丁,VPGAME上海技術團隊負責人,美國團隊架構師,曾任職于UCloud,負責基礎架構、中間件及分布式系統(tǒng)的工作。

聲明:本文為作者投稿,版權歸作者個人所有,首發(fā)于CSDN。

標簽: Google Mysql 大數(shù)據(jù) 大數(shù)據(jù)時代 機房 開發(fā)者 數(shù)據(jù)分析 域名

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:數(shù)據(jù)遷移二三事(寫于阿里云100PB數(shù)據(jù)大遷移之后)

下一篇:華為內(nèi)部狂轉-大數(shù)據(jù),看這一篇就夠了!