日本搞逼视频_黄色一级片免费在线观看_色99久久_性明星video另类hd_欧美77_综合在线视频

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 互聯網 > 【OSTC講師專訪】騰訊TDW項目:開源的分布式數據倉庫

【OSTC講師專訪】騰訊TDW項目:開源的分布式數據倉庫

來源:程序員人生   發布時間:2014-09-06 13:18:28 閱讀次數:3763次

編者按:CSDN “開源技術大會?2014” (OSTC?2014 )將于2014年3月30日在北京麗亭華苑酒店召開。我們將陸續發布參會講師的系列采訪,談談他們將在本次活動分享的內容。

本期,我們采訪的是騰訊TDW開源項目負責人、騰訊高級工程師趙偉


趙偉

趙偉,騰訊數據平臺部高級工程師,騰訊大數據平臺分布式數據倉庫(TDW)的技術負責人,開源軟件愛好者,是騰訊內部Hive、Pig、PostgreSQL、ZFS等開源技術的引入和推廣者。目前主要負責TDW平臺的穩定性、性能、易用性建設,同時負責TDW對外開源工作。

TDW,騰訊分布式數據倉庫項目,在Hadoop的基礎上開發的騰訊內部最大的離線數據處理平臺。TDW支持Oracle功能兼容的SQL語法,支持PB及的存儲和TB及的計算等。

以下是采訪記錄。

CSDN:請簡單的介紹一下TDW項目的應用場景。

趙偉:這個項目主要的應用場景是構建低成本的數據倉庫。我們知道傳統的數據倉庫需要專用的硬件和昂貴的軟件授權,使用TDW,可以基于廉價的PC Server構建數據倉庫。我們希望通過開源的TDW,降低數據倉庫的成本和建設門檻,促進企業對數據價值的發掘,提升國內企業的信息化水平。

CSDN:TDW歷經4年研發,這四年間產品的設計思路和實現方式是否經歷了什么變化?

趙偉:TDW在過去幾年的設計思路一直是“開源軟件”+“騰訊定制和優化”。使用開源軟件,大大節省了我們的研發成本和時間,可以快速搭建起原型,比如TDW核心的查詢引擎,是基于apache hive這個開源軟件。但是僅僅使用開源軟件,又不能完全滿足騰訊的業務需求,因此,我們需要再開源軟件基礎上,根據騰訊的業務特點,進行定制和優化。在TDW的研發過程中,我們基于hive和hadoop,依次經歷了數據倉庫功能完善、易用性建設、高可用和穩定性加強,性能和成本優化,安全建設等定制和優化。

CSDN:TDW在“騰訊海量數據處理平臺”中的位置及作用是怎樣的?

趙偉:TDW是騰訊海量數據處理平臺中最核心的模塊,它有以下幾個作用:

  1. 提供海量的離線計算和存儲服務。TDW 是騰訊內部規模最大的離線數據處理平臺,公司內大多數業務的產品報表、運營分析、數據挖掘等的存儲和計算都是在TDW中進行。這是TDW提供的最基礎的服務。
  2. 數據集中于共享功能。騰訊產品線較長,數據豐富,為了挖掘數據價值,經常需要訪問多個產品的數據。TDW 是騰訊公司級的數據倉庫,這里集中了大多數業務的數據,業務在這里可以方便的進行數據共享和管理。
  3. TDW為其他大數據服提供基礎和平臺。這有兩個含義,首先是TDW 對騰訊內部開放各種API接口,很多業務的數應用、數據處理平臺可以基于TDW之上,由TDW提供最基礎的存儲于計算,業務在TDW之上定制個性化的數據產品。其次,TDW內存放了騰訊大量有價值的數據,對于這些數據,各個業務有可能有一些不同的需求,這些需求可以抽象出一些固定的數據服務,如海量數據點查詢、快速多維分析、流式計算等,這些服務是TDW衍生出來的精細化的服務。

CSDN:作為一款分布式數據倉庫,TDW的技術架構是怎樣的?在TDW的設計和開發過程中最注重的是哪些部分?

趙偉:在架構上,TDW并沒有對開源軟件做大的修改。TDW的存儲和計算,主要采用hadoop的HDFS和MapReduce,TDW的SQL查詢引擎主要基于Hive。

TDW在研發的不同階段,有不同的側重點。在TDW研發開始那三年,我們主要對Hive進行定制和優化,使它更功能更豐富,更穩定,更易用。最近兩年,我們為了支撐更大規模的集群,在hadoop層做了大量優化,主要包括hadoop的master分散化和高可用。

CSDN:與其他類似分布式數據倉庫相比,TDW的優勢是什么?

趙偉:與其他商業數據庫比,當然是成本優勢。與社區的hive+hadoop比,TDW包含了大量功能,穩定性和性能優化,并且經過了騰訊生產環境的驗證。

CSDN:TDW今后的目標和開發計劃是什么?

趙偉:我們的目標有兩個:一個是使TDW運行效率更高,用戶體驗更好,包括將一些新的存儲計算引擎引入到TDW中,提供更快速的查詢分析響應;另外一個是更節省成本,我們將持續優化我們的存儲策略和計算機模型,使TDW的運營成本計量下降。

接下來一段時間的開發計劃大致有:

  • TDW對外部開源
  • TDW支持yarn
  • TDW支持shark、hbase等快速查詢引擎
  • TDW SQL優化器優化

CSDN:您能否簡單談下您在本次大會上要分享的話題。

趙偉:我本次大會上的議題是《基于開源軟件構建騰訊大數據平臺》,希望跟大家分享TDW所使用的開源軟件,以及基于之上的各種優化,以及TDW對外開源進展。

延伸閱讀

  • 騰訊趙偉: Hive在騰訊分布式數據倉庫的實踐
  • 騰訊公司數據平臺高級架構師 郭瑋: TDW在Hadoop上的實踐分享

據悉,騰訊未來會對一系列項目進行開源,CSDN CODE將會對此進行持續系列報道,敬請關注。


2014年3月30日,由CSDN主辦的“開源技術大會?2014”將在北京麗亭華苑酒店召開。多位開源界資深人士將出席大會并發表演講,歡迎大家親臨現場與大牛零距離交流。

>>>大會官網:http://ostc.csdn.net/

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 国产精品入口免费视 | 日韩精品在线观看视频 | 国产精品久久久久久久久久免费看 | 国产 麻豆 日韩 欧美 久久 | 99热| 国产精品久久久爽爽爽麻豆色哟哟 | 韩日精品一区 | 国产一区成人 | 草比网站 | 黄色一级毛片免费 | 99精品免费观看 | 中文字幕视频一区 | 福利视频一区二区三区 | 在线综合av | 日韩综合网| 天天看天天操 | 日韩一区精品 | 69视频免费在线观看 | 国产福利免费视频 | 亚洲一区二区欧美 | 97国产一区二区精品久久呦 | 国产精品亚洲第一区在线暖暖韩国 | aa国产| 亚洲一区二区在线免费观看 | 免费黄网站在线观看 | www.夜夜操.com| 91色在线观看 | 视频国产精品 | 91麻豆精品国产91久久久使用方法 | 精品电影一区二区 | 欧美精品久久久 | 久久久精品 | 国产精品一 | 亚洲第二区| 中文字幕国产日韩 | 国产福利资源 | 久久综合国产 | 国产成人精品视频 | 色大师高清在线播放免费 | av福利在线| 一区视频在线 |