溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

好程序員大數據學習路線之Logstach與flume對比

發布時間：2020-06-26 07:34:44 來源：網絡閱讀：234 作者：wx5d42865f47214 欄目：大數據

好程序員大數據學習路線之Logstach與flume對比，沒有集群的概念,logstach與flume都稱為組

logstash是用JRuby語言開發的

組件的對比:

　　logstach : input ?filter ?output

　　flume ???: source ?channel ?sink ?

優劣對比:

logstach :

?安裝簡單,安裝體積小

?有filter組件,使得該工具具有數據過濾,數據切分的功能

?可以與ES無縫結合

?具有數據容錯功能,在數據采集的時候,如果發生宕機或斷開的情況,會斷點續傳(會記錄讀取的偏移量)

　　綜上,該工具主要用途為采集日志數據

flume:

?高可用方面要比logstach強大

?flume一直在強調數據的安全性,flume在數據傳輸過程中是由事務控制的

?flume可以應用在多類型數據傳輸領域

數據對接

將logstach.gz文件上傳解壓即可

可以在logstach目錄下創建conf文件,用來存儲配置文件

一??命令啟動

1.bin/logstash -e 'input { stdin {} } output { stdout{} }' ?

　　stdin/stdout(標準輸入輸出流)

hello xixi

2018-09-12T21:58:58.649Z hadoop01 hello xixi

hello haha

2018-09-12T21:59:19.487Z hadoop01 hello haha

2.bin/logstash -e 'input { stdin {} } output { stdout{codec => rubydebug} }'

hello xixi

{

???????"message" => "hello xixi",

??????"@version" => "1",

????"@timestamp" => "2018-09-12T22:00:49.612Z",

??????????"host" => "hadoop01"

}

3.es集群中 ,需要啟動es集群

　　bin/logstash -e 'input { stdin {} } output { elasticsearch {hosts => ["192.168.88.81:9200"]} stdout{} }'

輸入命令后,es自動生成index,自動mapping.

hello haha

2018-09-12T22:13:05.361Z hadoop01 hehello haha

　　bin/logstash -e 'input { stdin {} } output { elasticsearch {hosts => ["192.168.88.81:9200", "192.168.88.82:9200"]} stdout{} }'

4.kafka集群中,啟動kafka集群

　　bin/logstash -e 'input { stdin {} } output { elasticsearch {hosts => ["192.168.88.81:9200", "192.168.88.82:9200"]} stdout{} }'

二??配置文件啟動

需要啟動zookeeper集群,kafka集群,es集群

1.與kafka數據對接

vi logstash-kafka.conf

　　啟動

　　bin/logstash -f logstash-kafka.conf ?(-f:指定文件)

　　在另一節點上啟動kafka消費命令

input {

??file {

????path => "/root/data/test.log"

????discover_interval => 5

????start_position => "beginning"

??}

}

?

output {

????kafka {

??topic_id => "test1"

??codec => plain {

????????format => "%{message}"

charset => "UTF-8"

??????}

??bootstrap_servers => "node01:9092,node02:9092,node03:9092"

????}

}

2.與kafka-es數據對接

vi logstash-es.conf

#啟動logstash

bin/logstash -f logstash-es.conf

　　在另一節點上啟動kafka消費命令

input {

file {

type => "gamelog"

path => "/log/*/*.log"

discover_interval => 10

start_position => "beginning"

}

}

?

output {

????elasticsearch {

index => "gamelog-%{+YYYY.MM.dd}"

????????hosts => ["node01:9200", "node02:9200", "node03:9200"]

????}

}

數據對接過程

logstach節點存放: 哪個節點空閑資源多放入哪個節點 (靈活存放)

1.啟動logstach監控logserver目錄,把數據采集到kafka

2.啟動另外一個logstach,監控kafka某個topic數據,把他采集到elasticsearch

數據對接案例

需要啟動兩個logstach,調用各個配置文件,進行對接

1.采集數據到kafka

　　cd conf

　　創建配置文件: vi gs-kafka.conf

input {

??file {

codec => plain {

??????charset => "GB2312"

????}

????path => "/root/basedir/*/*.txt"

????discover_interval => 5

????start_position => "beginning"

??}

}

?

output {

????kafka {

??topic_id => "gamelogs"

??codec => plain {

????????format => "%{message}"

charset => "GB2312"

??????}

??bootstrap_servers => "node01:9092,node02:9092,node03:9092"

????}

}

　　創建kafka對應的topic

bin/kafka-topics.sh --create --zookeeper hadoop01:2181 --replication-factor 1 --partitions 1 --topic gamelogs

2.在hadoop01上啟動logstach

　　bin/logstash -f conf/gs-kafka.conf

3.在hadoop02上啟動另外一個logstach

　　cd logstach/conf

　　vi kafka-es.conf

input {

??kafka {

????type => "accesslogs"

????codec => "plain"

????auto_offset_reset => "smallest"

????group_id => "elas1"

????topic_id => "accesslogs"

????zk_connect => "node01:2181,node02:2181,node03:2181"

??}

?

??kafka {

????type => "gamelogs"

????auto_offset_reset => "smallest"

????codec => "plain"

????group_id => "elas2"

????topic_id => "gamelogs"

????zk_connect => "node01:2181,node02:2181,node03:2181"

??}

}

?

filter {

??if [type] == "accesslogs" {

????json {

??????source => "message"

??remove_field => [ "message" ]

??target => "access"

????}

??}

?

??if [type] == "gamelogs" {

????mutate {

??????split => { "message" => " " }

??????add_field => {

????????"event_type" => "%{message[3]}"

????????"current_map" => "%{message[4]}"

????????"current_X" => "%{message[5]}"

????????"current_y" => "%{message[6]}"

????????"user" => "%{message[7]}"

????????"item" => "%{message[8]}"

????????"item_id" => "%{message[9]}"

????????"current_time" => "%{message[12]}"

?????}

?????remove_field => [ "message" ]

???}

??}

}

?

output {

?

??if [type] == "accesslogs" {

????elasticsearch {

??????index => "accesslogs"

??codec => "json"

??????hosts => ["node01:9200", "node02:9200", "node03:9200"]

????}

??}

?

??if [type] == "gamelogs" {

????elasticsearch {

??????index => "gamelogs1"

??????codec => plain {

????????charset => "UTF-16BE"

??????}

??????hosts => ["node01:9200", "node02:9200", "node03:9200"]

????}

??}

}

　　?bin/logstash -f conf/kafka-es.conf

4.修改basedir文件中任意數據即可產生es的index文件

5.網頁數據存儲在設置的/data/esdata中

6.在網頁中查找指定字段

　　默認分詞器為term,只能查找單個漢字,query_string可以查找全漢字

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
static在C和C++里各代表什么含義
下一篇新聞：
refresh-刷新

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女