婷婷丁香成人日日夜夜综合,日本黄色A级视频,日韩一品无码视频

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

如何使用Kafka Connect創(chuàng)建用于處理實時數(shù)據(jù)的開源數(shù)據(jù)管道？

譯文
作者：布加迪 2021-07-29 08:00:00

開發(fā)

前端

Kafka 本文介紹了如何使用完全開源的技術(shù)創(chuàng)建實時數(shù)據(jù)管道，這類開源技術(shù)包括 Kafka Connect、Apache Kafka和Kibana 等。

創(chuàng)新互聯(lián)公司是一家專注于成都做網(wǎng)站、網(wǎng)站設(shè)計、外貿(mào)營銷網(wǎng)站建設(shè)與策劃設(shè)計,班瑪網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)十載,網(wǎng)設(shè)計領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:班瑪?shù)鹊貐^(qū)。班瑪做網(wǎng)站價格咨詢:18982081108

【51CTO.com快譯】Kafka Connect是一種特別強(qiáng)大的開源數(shù)據(jù)流工具;有了它，將Kafka與其他數(shù)據(jù)技術(shù)結(jié)合使用非常輕松。作為一種分布式技術(shù)，Kafka Connect提供了特別高的可用性和獨立于Kafka集群的彈性擴(kuò)展。Kafka Connect使用源或sink連接件發(fā)送進(jìn)出Kafka主題的數(shù)據(jù)，無需代碼即可與多種非Kafka技術(shù)實現(xiàn)整合。

圖1

可靠的開源Kafka連接件可供許多流行的數(shù)據(jù)技術(shù)使用，您還有機(jī)會編寫自己的連接件。本文介紹了一個真實的實際數(shù)據(jù)用例，即如何使用Kafka Connect將來自Kafka的實時流數(shù)據(jù)與Elasticsearch(以啟用索引Kafka記錄的可擴(kuò)展搜索)和Kibana(以便可視化那些結(jié)果)整合起來。

圖2

針對表明Kafka和Kafka Connect優(yōu)點的一個用例，我受到CDC新冠疫情數(shù)據(jù)跟蹤器的啟發(fā)?；贙afka的跟蹤器從多個位置、以多種格式并使用多種協(xié)議收集實時新冠病毒檢測數(shù)據(jù)，并將這些事件處理成易于使用的可視化結(jié)果。跟蹤器還有必要的數(shù)據(jù)治理機(jī)制，以確保結(jié)果快速到達(dá)，并值得信任。

我開始尋找一個同樣復(fù)雜且引人注目的用例——但理想情況下，不像新冠疫情那樣令人擔(dān)憂。最終，我發(fā)現(xiàn)了一個有趣的領(lǐng)域：月潮，包括公開可用的流REST API和采用簡單JSON格式的豐富數(shù)據(jù)。

月潮數(shù)據(jù)

潮汐遵循太陰日，這是一個24小時50分鐘的周期;在此期間，地球完全自轉(zhuǎn)到軌道衛(wèi)星下方的同一點。每個太陰日有月球引力引起的兩個高潮和兩個低潮：

圖3. 來自美國國家海洋和大氣管理局

美國國家海洋和大氣管理局(NOAA)提供了一個REST API，可以從全球潮汐站輕松獲取詳細(xì)的傳感器數(shù)據(jù)。

圖4

比如說，下列REST調(diào)用指定了潮汐站ID、數(shù)據(jù)類型(我選擇了海平面)和數(shù)據(jù)(平均海平面)，并請求一個采用公制單位的最近結(jié)果：

https://api.tidesandcurrents.noaa.gov/api/prod/datagetter?date=latest&station=8724580&product=water_level&datum=msl&units=metric&time_zone=gmt&application=instaclustr&format=json

該調(diào)用返回JSON結(jié)果，含有潮汐站的經(jīng)緯度、時間和水位值。請注意，您必須記住您調(diào)用的是什么，以便了解所返回結(jié)果的數(shù)據(jù)類型、數(shù)據(jù)和單位!

  
 
 
    
  
  
  {"metadata": {    
  
  
     "id":"8724580",    
  
  
     "name":"Key West",    
  
  
     "lat":"24.5508”,    
  
  
     "lon":"-81.8081"},    
  
  
   "data":[{    
  
  
     "t":"2020-09-24 04:18",    
  
  
     "v":"0.597",    
  
  
        "s":"0.005", "f":"1,0,0,0", "q":"p"}]}

啟動數(shù)據(jù)管道(使用REST源連接件)

要開始創(chuàng)建Kafka Connect流數(shù)據(jù)管道，我們必須先準(zhǔn)備Kafka集群和Kafka Connect集群。

圖5

接下來，我們引入一個REST連接件，比如這個可用的開源連接件。我們會將其部署到AWS S3存儲桶(如果需要，參照這些說明)。然后我們將要求Kafka Connect集群使用S3存儲桶，對它同步以便在集群中可見，配置連接件，最后讓它運(yùn)行起來。這種“BYOC”(自帶連接件)方法確保您有無數(shù)的方法來尋找滿足特定要求的連接件。

圖6

下列示例演示使用“curl”命令將完全開源的Kafka Connect部署環(huán)境配置成可使用REST API。請注意，您需要更改URL、名稱和密碼以匹配您自己的部署：

  
 
 
    
  
  
  curl https://connectorClusterIP:8083/connectors -k -u name:password -X POST -H 'Content-Type: application/json' -d '    
  
  
  {    
  
  
      "name": "source_rest_tide_1",    
  
  
      "config": {    
  
  
        "key.converter":"org.apache.kafka.connect.storage.StringConverter",    
  
  
        "value.converter":"org.apache.kafka.connect.storage.StringConverter",    
  
  
        "connector.class": "com.tm.kafka.connect.rest.RestSourceConnector",    
  
  
        "tasks.max": "1",    
  
  
        "rest.source.poll.interval.ms": "600000",    
  
  
        "rest.source.method": "GET",    
  
  
        "rest.source.url": "https://api.tidesandcurrents.noaa.gov/api/prod/datagetter?date=latest&station=8454000&product=water_level&datum=msl&units=metric&time_zone=gmt&application=instaclustr&format=json",    
  
  
        "rest.source.headers": "Content-Type:application/json,Accept:application/json",    
  
  
        "rest.source.topic.selector": "com.tm.kafka.connect.rest.selector.SimpleTopicSelector",    
  
  
        "rest.source.destination.topics": "tides-topic"    
  
  
      }    
  
  
  }

該代碼創(chuàng)建的連接件任務(wù)以10分鐘為間隔輪詢REST API，并將結(jié)果寫入到“tides-topic”Kafka主題。通過隨機(jī)選擇五個潮汐傳感器以這種方式收集數(shù)據(jù)，潮汐數(shù)據(jù)現(xiàn)在通過五個配置和五個連接件填充了潮汐主題。

圖7

結(jié)束管道(使用Elasticsearch sink連接件)

為了將該潮汐數(shù)據(jù)放在某個地方，我們將在管道末端引入Elasticsearch集群和Kibana。我們將配置一個開源Elasticsearch sink連接件，以便向Elasticsearch發(fā)送數(shù)據(jù)。

圖8

以下示例配置使用sink名稱、類、Elasticsearch索引和我們的Kafka主題。如果索引尚未存在，會創(chuàng)建一個有默認(rèn)映射的索引。

  
 
 
    
  
  
  curl https://connectorClusterIP:8083/connectors -k -u name:password -X POST -H 'Content-Type: application/json' -d '    
  
  
  {    
  
  
    "name" : "elastic-sink-tides",    
  
  
    "config" :    
  
  
    {    
  
  
      "connector.class" : "com.datamountaineer.streamreactor.connect.elastic7.ElasticSinkConnector",    
  
  
      "tasks.max" : 3,    
  
  
      "topics" : "tides",    
  
  
      "connect.elastic.hosts" : ”ip",    
  
  
      "connect.elastic.port" : 9201,    
  
  
      "connect.elastic.kcql" : "INSERT INTO tides-index SELECT * FROM tides-topic",    
  
  
      "connect.elastic.use.http.username" : ”elasticName",    
  
  
      "connect.elastic.use.http.password" : ”elasticPassword"    
  
  
    }    
  
  
  }'

該管道現(xiàn)在可運(yùn)作起來。然而，由于默認(rèn)索引映射，進(jìn)入到Tides索引的所有潮汐數(shù)據(jù)是字符串。

圖9

需要自定義映射以準(zhǔn)確地繪制我們的時間序列數(shù)據(jù)。我們將為下面的潮汐索引創(chuàng)建這個自定義映射，使用JSON“t”字段用于自定義日期，“v”作為兩倍數(shù)，“name”作為代表聚合的關(guān)鍵字。

  
 
 
    
  
  
  curl -u elasticName:elasticPassword ”elasticURL:9201/tides-index"  -X PUT -H 'Content-Type: application/json' -d'    
  
  
  {    
  
  
  "mappings" : {    
  
  
    "properties" : {    
  
  
       "data" : {    
  
  
          "properties" : {    
  
  
               "t" : { "type" : "date",    
  
  
                       "format" : "yyyy-MM-dd HH:mm"    
  
  
               },    
  
  
               "v" : { "type" : "double" },    
  
  
               "f" : { "type" : "text" },    
  
  
               "q" : { "type" : "text" },    
  
  
               "s" : { "type" : "text" }    
  
  
               }    
  
  
         },    
  
  
         "metadata" : {    
  
  
            "properties" : {    
  
  
               "id" : { "type" : "text" },    
  
  
               "lat" : { "type" : "text" },    
  
  
               "long" : { "type" : "text" },    
  
  
               "name" : { "type" : ”keyword" } }}}}         }'

每次更改Elasticsearch索引映射時，通常都需要Elasticsearch“重新索引”(刪除索引并重新索引所有數(shù)據(jù))。數(shù)據(jù)既可以從現(xiàn)有的Kafka sink連接件重放，就像我們在這個用例中所做的那樣，也可以使用Elasticsearch重新索引操作來獲取。

使用Kibana可視化數(shù)據(jù)

為了可視化潮汐數(shù)據(jù)，我們先用Kibana創(chuàng)建一個索引模式，將“t”配置為時間過濾器字段。然后，我們將創(chuàng)建一個可視化，選擇線圖類型。最后，我們將配置圖設(shè)置，以便y軸顯示30分鐘內(nèi)的平均潮位，x 軸顯示隨時間變化的該數(shù)據(jù)。

結(jié)果是下圖顯示了五個樣本潮汐站的潮汐變化，管道從這些潮汐站收集數(shù)據(jù)：

圖10

結(jié)果

我們可以從可視化中清楚地看到潮汐的周期性，每個太陰日出現(xiàn)兩次高潮。

圖11

更令人驚訝的是，每個全球潮汐站的高潮和低潮之間的間隔不一樣。這不僅受月球的影響，還受太陽、當(dāng)?shù)氐乩?、天氣和氣候變化的影響。這個示例Kafka Connect管道利用Kafka、Elasticsearch和Kibana幫助演示可視化的優(yōu)點：它們通?？梢越沂驹紨?shù)據(jù)無法揭示的信息!

分享標(biāo)題：如何使用Kafka Connect創(chuàng)建用于處理實時數(shù)據(jù)的開源數(shù)據(jù)管道？
鏈接分享：http://m.5511xx.com/article/cccheoc.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

如何使用Kafka Connect創(chuàng)建用于處理實時數(shù)據(jù)的開源數(shù)據(jù)管道？

月潮數(shù)據(jù)

啟動數(shù)據(jù)管道(使用REST源連接件)

結(jié)束管道(使用Elasticsearch sink連接件)

使用Kibana可視化數(shù)據(jù)

結(jié)果

其他資訊

新聞中心

如何使用Kafka Connect創(chuàng)建用于處理實時數(shù)據(jù)的開源數(shù)據(jù)管道？

月潮數(shù)據(jù)

啟動數(shù)據(jù)管道(使用REST源連接件)

結(jié)束管道(使用Elasticsearch sink連接件)

使用Kibana可視化數(shù)據(jù)

結(jié)果

其他資訊

如何使用Kafka Connect創(chuàng)建用于處理實時數(shù)據(jù)的開源數(shù)據(jù)管道？