日本搞逼视频_黄色一级片免费在线观看_色99久久_性明星video另类hd_欧美77_综合在线视频

國內(nèi)最全IT社區(qū)平臺 聯(lián)系我們 | 收藏本站
阿里云優(yōu)惠2
您當前位置:首頁 > 互聯(lián)網(wǎng) > 如何結(jié)合AWS與Fluented進行數(shù)據(jù)收集

如何結(jié)合AWS與Fluented進行數(shù)據(jù)收集

來源:程序員人生   發(fā)布時間:2014-10-15 07:16:54 閱讀次數(shù):5047次

近日,亞馬遜在其官方博客發(fā)布了AWS與Fluentd結(jié)合起來進行數(shù)據(jù)收集,存儲和處理的相關(guān)操作方法和案例,AWS和Fluentd的結(jié)合使數(shù)據(jù)處理更加快捷。

以下為譯文:

數(shù)據(jù)存儲便宜,但數(shù)據(jù)收集并不便宜

數(shù)據(jù)存儲十分便宜。但Kiyoto所說的便宜不是指其硬件很便宜,而是指數(shù)據(jù)的存儲操作以及人工成本非常便宜。感謝IaaS的應(yīng)用,就像AWS,我們不需要再花費很多時間進行容量規(guī)劃(或者更好的是,可以用自動可擴展的方式提供資源)或者擔心我們的服務(wù)器發(fā)生故障。



相對便宜的存儲意味著我們的想法不再數(shù)據(jù)存儲量而束縛。僅需要少數(shù)工程師就可以在Amazon Simple Storage Service(S3)平臺中完成運行一組數(shù)據(jù),或者是Redshift instances或者是管理大量日志數(shù)據(jù)備份,備份他們?nèi)粘5墓ぷ饔涗?。分析海量的?shù)據(jù)不再僅僅屬于那些獨享大全,精通技術(shù)的公司。

然而,數(shù)據(jù)收集仍然是一個重大挑戰(zhàn):數(shù)據(jù)不會奇跡般的存儲在系統(tǒng)中或者進行自行整理。因此,許多(臨時)腳本被用作解析加載數(shù)據(jù)。這些腳本易變,易錯,而且?guī)缀醪豢赡苎由臁?/p>


這些問題都是Fluentd嘗試要解決的:可擴展,靈活的實時收集數(shù)據(jù)。Kiyoto在博文中也講到Fluentd的基本結(jié)構(gòu),同時分享了一些AWS使用案例。

Fluentd:大容量數(shù)據(jù)流的開源數(shù)據(jù)采集器

Fluentd原本是寫在Treasure Data中的一個開源數(shù)據(jù)采集器。在2011年10月開源,并在過去的2年半時間獲得了穩(wěn)步牽引:今天,我們有一個蓬勃發(fā)展的社區(qū),在GitHub有50人的貢獻者和超過2100人的追隨者,與Slideshare公司和Nintendo共同部署數(shù)據(jù)生產(chǎn)。

輸入和輸出

在最高的等級,F(xiàn)luentd包含輸入和輸出。輸入是指定Fluentd如何以及何時攝取數(shù)據(jù)。

普遍輸入是:

1.跟蹤日志文件和解析每行數(shù)據(jù)(或者同時解析多行數(shù)據(jù))

2.接收系統(tǒng)日志信息

3.接收HTTP請求以及解析信息內(nèi)容

輸入的兩個關(guān)鍵特征:JSON和標記

1.Fluentd采取JSON為它的核心數(shù)據(jù)形式,每個輸入的作用是將接通的輸入數(shù)據(jù)轉(zhuǎn)換為一系列的JSON“事件”。

2.每個輸入都為其攝取的數(shù)據(jù)提供了一個標簽。根據(jù)標簽,F(xiàn)luentd決定如何處理不同來源的數(shù)據(jù)(如下)。

當數(shù)據(jù)通過Fluentd輸入 ,F(xiàn)luentd標記每個事件(在2中有所解釋)然后指定線路輸出標記,例如本地文件系統(tǒng),RDBMSs,NoSQL數(shù)據(jù)庫以及AWS服務(wù)。

開放和插件架構(gòu)

為什么Fluentd已經(jīng)有很多輸入以及輸出。秘訣是開放和插件架構(gòu)。Ruby最基本的常識就是用戶可以在短時間內(nèi)構(gòu)建一個新的插件。毋庸置疑,許多Fluentd用戶非常熱衷于AWS,所以,我們已經(jīng)在如下的AWS服務(wù)中安置插件:

1.Amazon Simple Storage Service(S3) (輸出)

2.Amazon Redshift (輸出)

3.Amazon Simple Queue Service (SQS) (輸入和輸出)

4.Amazon Kinesis (輸出)

5.Amazon DynamodB (輸出)

6.AWS CloudWatch (輸入)

性能和可靠性

當我“坦白”Fluentd大部分內(nèi)容在Ruby中編寫的,客戶非常擔心Fluentd的性能。不用擔心,F(xiàn)luentd非常快速,在現(xiàn)代的服務(wù)器中,它可以在單核中的處理速度達到15000次/秒,如果在多核中運行Fluentd,你可以獲得更好的輸出。

Fluentd可以達到這樣的速度是通過使用C語言底層類庫編寫軟件性能關(guān)鍵的部分。例如Fluentd運用Cool.io(Masahiro Nakagawa,F(xiàn)luentd主要維護者)進行事件循環(huán),和Ruby中的MessagePack(Sadayuki Furuhash,F(xiàn)luentd的原作者)來提供內(nèi)部數(shù)據(jù)形式。

速度很好,日志收集必須非??煽?數(shù)據(jù)流失導(dǎo)致了壞數(shù)據(jù)和糟糕的決定。Fluentd通過緩沖來確??煽啃?。輸出插件可以通過記憶卡或者是閃存卡配置緩存數(shù)據(jù),所以當數(shù)據(jù)傳輸發(fā)生錯誤時,它不會丟失。緩沖邏輯高度可調(diào),并且可以為客戶定制各種容量以及延遲需求。

舉例:Apache日志歸檔入S3

Fluentd的功能概述,讓我們深入一個例子。下面將會展示怎樣設(shè)置Fluentd來實現(xiàn)Apache網(wǎng)絡(luò)服務(wù)器日志歸檔于S3。

第一步:運行Fluentd

在Ruby的gem界面打開Fluentd (gem install fluentd)。也可以從Treasure Data中找到相關(guān)的td-agent?,F(xiàn)在,我們運行td-agent,Kiyoto假設(shè)在Ubuntu Precise界面(12.04)。td-agent同樣適用于Ubuntu Lucid和CentOS 5/6,以及即將發(fā)行的Ubuntu Trusty。

運行以下指令:

curl -L <a >http://toolbelt.treasuredata.com/sh/install-ubuntu-precise.sh</a> | sh

用戶通過以下指令可以檢查td-agent是否安裝成功。

$ which td-agent

/usr/sbin/td-agent

第二步:配置輸入和輸出

對于td-agent,該配置文件位于/etc/td-agent/td-agent.conf。再次配置,跟蹤Apache日志文件。

<source>
  type tail
  format apache2
  path /var/log/apache2/access_log
  pos_file /var/log/td-agent/apache2.access_log.pos
  tag s3.apache.access
</source>
這個片段配置Apache日志文件輸入。Fluentd跟蹤日志文件放置在/var/log/apache2/access_log,根據(jù)Apache組合日志形式解析,并且作標記s3.apache.access。

下面,我們配置S3輸出,如下:

<match s3.*.*>
  type s3

  s3_bucket YOUR_BUCKET_NAME
  path logs/
  buffer_path /var/log/td-agent/s3

  time_slice_format %Y%m%d%H
  time_slice_wait 10m
  utc
  
  format_json true
  include_time_key true
  include_tag_key true

  buffer_chunk_limit 256m
</match>

<match s3.*.*>告訴Fluentd與以下標記相匹配1)三部分2)以S3為開頭。所有來自Apache進入日志的事件都有s3.apache.access標記,它們在這里相配,然后輸送入S3。

最后,讓我們在更新配置上開始td-agent

$ sudo service td-agent start
* Starting td-agent td-agent          [OK]

你的數(shù)據(jù)中也許需要10分鐘才會在S3中顯示,這意味數(shù)據(jù)需要緩沖(參照"time_slice_wait")。但是,最終日志會在YOUR_BUCKET_NAME/logs/yyyyMMddHH中顯示。同樣的,要確保Fluentd有編寫程序進入S3集。以下是IAM的設(shè)置。

{
      "Effect": "Allow",
      "Action": [
        "s3:Get*", "s3:List*","s3:Put*", "s3:Post*"
      ],
      "Resource": [
        "arn:aws:s3:::YOUR_BUCKET_NAME/logs/*", "arn:aws:s3::: YOUR_BUCKET_NAME"
      ]
}
上面的概述和例子只是Fluentd與AWS結(jié)合的使用的冰山一角,用戶可以通過更多的資訊了解更多關(guān)于AWS的相關(guān)信息。

原文鏈接:http://aws.amazon.com/cn/blogs/aws/all-your-data-fluentd/

如您需要了解AWS最新資訊或是技術(shù)文檔可訪問AWS中文技術(shù)社區(qū);如您有更多的疑問請在AWS技術(shù)論壇提出,稍后會有專家進行答疑。 


訂閱“AWS中文技術(shù)社區(qū)”微信公眾號,實時掌握AWS技術(shù)及產(chǎn)品消息!

AWS中文技術(shù)社區(qū)為廣大開發(fā)者提供了一個Amazon Web Service技術(shù)交流平臺,推送AWS最新資訊、技術(shù)視頻、技術(shù)文檔、精彩技術(shù)博文等相關(guān)精彩內(nèi)容,更有AWS社區(qū)專家與您直接溝通交流!快加入AWS中文技術(shù)社區(qū),更快更好的了解AWS云計算技術(shù)。


如您需要了解AWS最新資訊或是技術(shù)文檔可訪問AWS中文技術(shù)社區(qū);如您有更多的疑問請在AWS技術(shù)論壇提出,稍后會有專家進行答疑。 

                                                                                                            (譯者/李雪 責編/王玉平) 

生活不易,碼農(nóng)辛苦
如果您覺得本網(wǎng)站對您的學(xué)習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關(guān)閉
程序員人生
主站蜘蛛池模板: 亚洲午夜久久久久久久久久久 | avav在线看 | 黄色日韩| 最新免费av | 日韩高清网站 | 黄色在线观看免费视频 | av一区二区三区 | 人妖在线视频 | 夜夜摸夜夜操 | 成人午夜小视频 | 久久一级精品 | 国产黄色av | 日本a v网站 | 亚洲最大成人在线 | 免费在线成人 | 国产最新视频 | 国产在线精品视频 | 国产一区二区三区不卡在线观看 | 国产精品99视频 | 国产在线一区二区三区 | 精品久久久久一区二区 | 久久综合久 | 精久久 | 天天色天天 | 亚洲永久| 自拍偷拍亚洲欧美 | 免费观看一级特黄欧美大片 | 成人国产精品久久久按摩 | 偷拍自拍第一页 | 精品久久久久久久久久久aⅴ | 国产精品久久久久久久久 | 一级黄色毛片子 | 亚洲国产精品久久久 | 久久毛片| 亚洲精品日韩精品 | 亚洲一区二区综合 | 在线激情av| 欧美日韩国产综合在线 | 日韩一区二区在线免费观看 | 精品1区2区 | 自拍欧美亚洲 |