詳細(xì)講解Docker-Compose部署Kafka?KRaft集群環(huán)境
概述
Kafka的環(huán)境配置花了我好幾天時(shí)間才搞明白,現(xiàn)整理一下。
原來(lái)公司對(duì)Kafka環(huán)境的安裝是這樣的:
- 獲?。ㄏ螺d)Zookeeper和Kafka的Linux安裝包
- 安裝Zookeeper前保證有Java環(huán)境
- 修改配置文件
- 根據(jù)官網(wǎng)教程逐步安裝
原來(lái)的環(huán)境部署方式已經(jīng)有些落后了,現(xiàn)在我們搭建環(huán)境基本都會(huì)采用Docker容器,不僅簡(jiǎn)化了部署流程,還方便管理。
在Kafka2.8版本之前,Kafka是強(qiáng)依賴于Zookeeper中間件的,這本身就很不合理,中間件依賴另一個(gè)中間件,搭建起來(lái)實(shí)在麻煩,并且Zookeeper需要搭建三個(gè)以上服務(wù)作為集群(不考慮掛掉的話一個(gè)也可以,但這就不叫集群了,只能算單節(jié)點(diǎn)),Kafka也要三個(gè)以上做集群(為了數(shù)據(jù)的高可用),所幸Kafka2.8之后推出了KRaft模式,即拋棄Zookeeper,由Kafka節(jié)點(diǎn)自己做Controller來(lái)選舉Leader,本篇文章內(nèi)容就是介紹如何在Docker-Compose中搭建Kafka KRaft環(huán)境。
環(huán)境準(zhǔn)備
Docker & Docker-Compose
需要提前準(zhǔn)備好Docker和Docker-Compose環(huán)境,如果沒(méi)有安裝是不行的
Linux服務(wù)器
可以是Windows下的VMware虛擬機(jī),也可以是云服務(wù)器
順帶說(shuō)明一下我當(dāng)前的環(huán)境吧:
- 開(kāi)發(fā)機(jī)是Windows,因?yàn)樾枰狶inux環(huán)境,所以整了個(gè)虛擬機(jī)安裝CentOS 7(有Docker),在這上面搭建我開(kāi)發(fā)時(shí)需要的所有環(huán)境,比如MySQL、Redis等,這樣可以保證開(kāi)發(fā)和生產(chǎn)的環(huán)境一致,也不用另一套在Windows上搭建環(huán)境的學(xué)習(xí)成本。
- 虛擬機(jī)上的CentOS,上面有說(shuō),在這里只安裝了Docker & Docker-Compose,然后搭建容器環(huán)境給開(kāi)發(fā)時(shí)用。
- 云服務(wù)器,同樣也是CentOS7環(huán)境,畢竟光開(kāi)發(fā)是不夠的,應(yīng)用到生產(chǎn)環(huán)境上才算部署完整,因?yàn)榇蟾怕饰覀儠?huì)需要Nginx轉(zhuǎn)發(fā)等配置,和開(kāi)發(fā)環(huán)境會(huì)有些許不同,所以最終目的是要在云服務(wù)器上搭建完成才可以。
步驟一:部署到開(kāi)發(fā)環(huán)境上
首先讓我們?cè)陂_(kāi)發(fā)環(huán)境上面部署好Kafka環(huán)境,然后寫(xiě)一個(gè)Spring Boot應(yīng)用去連接。
docker-compose.yml文件編寫(xiě)
version: "3"
services:
kafka1:
image: 'bitnami/kafka:3.3.1'
network_mode: mynetwork
container_name: kafka11
user: root
ports:
- 9192:9092
- 9193:9093
environment:
### 通用配置
# 允許使用kraft,即Kafka替代Zookeeper
- KAFKA_ENABLE_KRAFT=yes
# kafka角色,做broker,也要做controller
- KAFKA_CFG_PROCESS_ROLES=broker,controller
# 指定供外部使用的控制類請(qǐng)求信息
- KAFKA_CFG_CONTROLLER_LISTENER_NAMES=CONTROLLER
# 定義kafka服務(wù)端socket監(jiān)聽(tīng)端口
- KAFKA_CFG_LISTENERS=PLAINTEXT://:9092,CONTROLLER://:9093
# 定義安全協(xié)議
- KAFKA_CFG_LISTENER_SECURITY_PROTOCOL_MAP=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
# 使用Kafka時(shí)的集群id,集群內(nèi)的Kafka都要用這個(gè)id做初始化,生成一個(gè)UUID即可
- KAFKA_KRAFT_CLUSTER_ID=LelM2dIFQkiUFvXCEcqRWA
# 集群地址
- KAFKA_CFG_CONTROLLER_QUORUM_VOTERS=1@kafka11:9093,2@kafka22:9093,3@kafka33:9093
# 允許使用PLAINTEXT監(jiān)聽(tīng)器,默認(rèn)false,不建議在生產(chǎn)環(huán)境使用
- ALLOW_PLAINTEXT_LISTENER=yes
# 設(shè)置broker最大內(nèi)存,和初始內(nèi)存
- KAFKA_HEAP_OPTS=-Xmx512M -Xms256M
# 不允許自動(dòng)創(chuàng)建主題
- KAFKA_CFG_AUTO_CREATE_TOPICS_ENABLE=false
?
### broker配置
# 定義外網(wǎng)訪問(wèn)地址(宿主機(jī)ip地址和端口)
- KAFKA_CFG_ADVERTISED_LISTENERS=PLAINTEXT://192.168.1.54:9192
# broker.id,必須唯一
- KAFKA_BROKER_ID=1
volumes:
- /home/mycontainers/kafka1/kafka/kraft:/bitnami/kafka
#extra_hosts:
#- "kafka1:云服務(wù)器IP"
#- "kafka2:云服務(wù)器IP"
#- "kafka3:云服務(wù)器IP"
kafka2:
image: 'bitnami/kafka:3.3.1'
network_mode: mynetwork
container_name: kafka22
user: root
ports:
- 9292:9092
- 9293:9093
environment:
### 通用配置
# 允許使用kraft,即Kafka替代Zookeeper
- KAFKA_ENABLE_KRAFT=yes
# kafka角色,做broker,也要做controller
- KAFKA_CFG_PROCESS_ROLES=broker,controller
# 指定供外部使用的控制類請(qǐng)求信息
- KAFKA_CFG_CONTROLLER_LISTENER_NAMES=CONTROLLER
# 定義kafka服務(wù)端socket監(jiān)聽(tīng)端口
- KAFKA_CFG_LISTENERS=PLAINTEXT://:9092,CONTROLLER://:9093
# 定義安全協(xié)議
- KAFKA_CFG_LISTENER_SECURITY_PROTOCOL_MAP=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
# 使用Kafka時(shí)的集群id,集群內(nèi)的Kafka都要用這個(gè)id做初始化,生成一個(gè)UUID即可
- KAFKA_KRAFT_CLUSTER_ID=LelM2dIFQkiUFvXCEcqRWA
# 集群地址
- KAFKA_CFG_CONTROLLER_QUORUM_VOTERS=1@kafka11:9093,2@kafka22:9093,3@kafka33:9093
# 允許使用PLAINTEXT監(jiān)聽(tīng)器,默認(rèn)false,不建議在生產(chǎn)環(huán)境使用
- ALLOW_PLAINTEXT_LISTENER=yes
# 設(shè)置broker最大內(nèi)存,和初始內(nèi)存
- KAFKA_HEAP_OPTS=-Xmx512M -Xms256M
# 不允許自動(dòng)創(chuàng)建主題
- KAFKA_CFG_AUTO_CREATE_TOPICS_ENABLE=false
?
### broker配置
# 定義外網(wǎng)訪問(wèn)地址(宿主機(jī)ip地址和端口)
- KAFKA_CFG_ADVERTISED_LISTENERS=PLAINTEXT://192.168.1.54:9292
# broker.id,必須唯一
- KAFKA_BROKER_ID=2
volumes:
- /home/mycontainers/kafka2/kafka/kraft:/bitnami/kafka
kafka3:
image: 'bitnami/kafka:3.3.1'
network_mode: mynetwork
container_name: kafka33
user: root
ports:
- 9392:9092
- 9393:9093
environment:
### 通用配置
# 允許使用kraft,即Kafka替代Zookeeper
- KAFKA_ENABLE_KRAFT=yes
# kafka角色,做broker,也要做controller
- KAFKA_CFG_PROCESS_ROLES=broker,controller
# 指定供外部使用的控制類請(qǐng)求信息
- KAFKA_CFG_CONTROLLER_LISTENER_NAMES=CONTROLLER
# 定義kafka服務(wù)端socket監(jiān)聽(tīng)端口
- KAFKA_CFG_LISTENERS=PLAINTEXT://:9092,CONTROLLER://:9093
# 定義安全協(xié)議
- KAFKA_CFG_LISTENER_SECURITY_PROTOCOL_MAP=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
# 使用Kafka時(shí)的集群id,集群內(nèi)的Kafka都要用這個(gè)id做初始化,生成一個(gè)UUID即可
- KAFKA_KRAFT_CLUSTER_ID=LelM2dIFQkiUFvXCEcqRWA
# 集群地址
- KAFKA_CFG_CONTROLLER_QUORUM_VOTERS=1@kafka11:9093,2@kafka22:9093,3@kafka33:9093
# 允許使用PLAINTEXT監(jiān)聽(tīng)器,默認(rèn)false,不建議在生產(chǎn)環(huán)境使用
- ALLOW_PLAINTEXT_LISTENER=yes
# 設(shè)置broker最大內(nèi)存,和初始內(nèi)存
- KAFKA_HEAP_OPTS=-Xmx512M -Xms256M
# 不允許自動(dòng)創(chuàng)建主題
- KAFKA_CFG_AUTO_CREATE_TOPICS_ENABLE=false
?
### broker配置
# 定義外網(wǎng)訪問(wèn)地址(宿主機(jī)ip地址和端口)
- KAFKA_CFG_ADVERTISED_LISTENERS=PLAINTEXT://192.168.1.54:9392
# broker.id,必須唯一
- KAFKA_BROKER_ID=3
volumes:
- /home/mycontainers/kafka3/kafka/kraft:/bitnami/kafka
配置文件說(shuō)明: 如果你懂一些docker-compose的話,這個(gè)配置文件應(yīng)該很好明白,這里挑一些來(lái)說(shuō):
鏡像選擇:bitnami/kafka:3.3.1
這是寫(xiě)這篇文章時(shí)最新的版本
容器名是:kafka11、kafka22、kafka33
這個(gè)當(dāng)然隨便寫(xiě),我用11、22、33是為了后面演示生產(chǎn)環(huán)境時(shí)不沖突,先不用管,后面會(huì)說(shuō)
端口配置是9092和9093:
9092端口用于BROKER傳輸,即Kafka集群服務(wù)端口,我們用Kafka腳本或SpringBoot應(yīng)用時(shí),連接的就是這個(gè)端口;9093是CONTROLLER端口,前面說(shuō)過(guò),我們拋棄了Zookeeper,用Kafka來(lái)代替,這個(gè)9093就是充當(dāng)著原來(lái)Zookeeper集群的通訊端口
總結(jié)一下,9092用于外網(wǎng),因?yàn)槭荎afka要給外部訪問(wèn);9093用于內(nèi)網(wǎng),只用于集群通訊,用于內(nèi)網(wǎng)是因?yàn)榄h(huán)境都搭建在一個(gè)服務(wù)器的Docker容器內(nèi),相當(dāng)于公司服務(wù)器內(nèi)網(wǎng),所以不對(duì)外開(kāi)放,生產(chǎn)時(shí)一般會(huì)搭建在不同的服務(wù)器上面,可以是外網(wǎng)也可以是內(nèi)網(wǎng),集群的環(huán)境配置自由度很高,這點(diǎn)我就不多說(shuō)明了。
network_mode:
給容器加入網(wǎng)絡(luò),這樣才可以進(jìn)行容器間的通訊,可以讓容器1中能識(shí)別容器2的容器名稱,進(jìn)而解析出IP,很重要,不然只能手動(dòng)配置容器IP,不過(guò)這樣很蠢,容器IP不固定,會(huì)動(dòng)態(tài)變化。
當(dāng)然用--link也可以。
KAFKA_KRAFT_CLUSTER_ID:
KRaft模式下,要配置這個(gè)集群ID,這個(gè)ID可以用Kafka命令去生成:
kafka-storage.sh random-uuid
一開(kāi)始就用官網(wǎng)示例的LelM2dIFQkiUFvXCEcqRWA就可以了。
KAFKA_BROKER_ID:
broker的id,這個(gè)要唯一,搞過(guò)Kafka的懂的都懂
KAFKA_CFG_ADVERTISED_LISTENERS:
對(duì)外的訪問(wèn)地址,我配置的是192.168.1.54,因?yàn)槲疫@臺(tái)虛擬機(jī)用的是橋接網(wǎng)絡(luò),分配的IP就是192.168.1.54,這個(gè)和容器IP不一樣,容器IP只用于容器間的通訊,這個(gè)54的配置目的是可以在開(kāi)發(fā)機(jī)上(假如開(kāi)發(fā)機(jī)的IP是192.168.1.10)通過(guò):192.168.1.54:9092來(lái)連接Kafka,很重要
因?yàn)橛腥齻€(gè)Kafka容器,容器內(nèi)部都用9092和9093端口保持一致,所以端口映射就有所不同:
kafka1配置9192、9193;kafka2配置9292、9293;kafka3配置9392、9393
這個(gè)配置也很重要
extra_hosts:
這個(gè)配置的目的是修改容器內(nèi)的hosts文件,增加一個(gè)IP的別名映射,在開(kāi)發(fā)階段用不上,是后面部署生產(chǎn)環(huán)境時(shí)用的,暫時(shí)不用理會(huì),這時(shí)候可以先注釋掉。
其他的看注釋就可以了,還有的是在YML配置文件對(duì)Kafka的配置,比如KAFKA_ENABLE_KRAFT,是從Docker Hub的Kafka鏡像文檔上看的,這是一種快速配置手段,但我們同樣可以使用老辦法,將kafka的配置文件(server.properties)進(jìn)行路徑映射,如果熟悉docker應(yīng)該能理解。
運(yùn)行啟動(dòng)腳本
docker-compose -f docker-compose.yml up
如果沒(méi)有報(bào)錯(cuò),通過(guò)docker ps可以看到Kafka容器:
[root@localhost ~]# docker ps | grep kafka 80cf69513390 provectuslabs/kafka-ui:latest "/bin/sh -c 'java $J…" 14 hours ago Up 14 hours 0.0.0.0:17008->8080/tcp, :::17008->8080/tcp kafka-ui c66b8c979abb bitnami/kafka:3.3.1 "/opt/bitnami/script…" 14 hours ago Up 4 hours 0.0.0.0:9292->9092/tcp, :::9292->9092/tcp, 0.0.0.0:9293->9093/tcp, :::9293->9093/tcp kafka2 70f26172ba3e bitnami/kafka:3.3.1 "/opt/bitnami/script…" 14 hours ago Up 4 hours 0.0.0.0:9392->9092/tcp, :::9392->9092/tcp, 0.0.0.0:9393->9093/tcp, :::9393->9093/tcp kafka3 0193e15cd92a bitnami/kafka:3.3.1 "/opt/bitnami/script…" 15 hours ago Up 4 hours 0.0.0.0:9192->9092/tcp, :::9192->9092/tcp, 0.0.0.0:9193->9093/tcp, :::9193->9093/tcp kafka1
注意:在啟動(dòng)容器的時(shí)候,不出意外的話會(huì)出很多意外,檢查一下腳本有沒(méi)有問(wèn)題,重點(diǎn)排查KAFKA_BROKER_ID和KAFKA_CFG_ADVERTISED_LISTENERS。還有容器名稱不要沖突,區(qū)分好1、2、3,路徑映射也不要弄錯(cuò),kafka1、kafka2、kafka3。
(拓展)容器可視化頁(yè)面
如果嫌棄docker ps,可以安裝portainer來(lái)查看可視化容器頁(yè)面:
version: "3"
services:
portainer:
container_name: portainer
ports:
- 9000:9000
restart: always
network_mode: mynetwork
volumes:
- /etc/localtime:/etc/localtime
- /var/run/docker.sock:/var/run/docker.sock
- /home/mycontainers/portainer/data:/data:rw
image: portainer/portainer
訪問(wèn):http://localhost:9000,即可,請(qǐng)自行修改端口和IP
(拓展)Kafka可視化頁(yè)面
kafka-ui是Apache出品的Kafka可視化容器,入門(mén)是夠用了,當(dāng)然還有很多可視化工具,由于篇幅關(guān)系,并且這不是本文重點(diǎn),所以就不細(xì)說(shuō)了。
version: "3"
services:
kafka-ui:
image: provectuslabs/kafka-ui:latest
network_mode: mynetwork
container_name: kafka-ui
restart: always
ports:
- 8080:8080
volumes:
- /etc/localtime:/etc/localtime
environment:
# 集群名稱
- KAFKA_CLUSTERS_0_NAME=local
# 集群地址
- KAFKA_CLUSTERS_0_BOOTSTRAPSERVERS=kafka11:9092,kafka22:9092,kafka33:9092
訪問(wèn):http://localhost:8080,即可,請(qǐng)自行修改端口和IP
用腳本命令進(jìn)行測(cè)試
Kafka容器內(nèi)有自帶腳本可以使用,所以部署完Kafka環(huán)境后,最簡(jiǎn)單快速的方式就是進(jìn)入容器內(nèi)進(jìn)行測(cè)試:
進(jìn)入任意一個(gè)Kafka容器
docker exec -it kafka11 bash
創(chuàng)建一個(gè)主題,名稱為demo
kafka-topics.sh --create --topic demo --partitions 3 --replication-factor 3 --bootstrap-server kafka11:9092,kafka22:9092,kafka33:9092
查看所有主題
kafka-topics.sh --bootstrap-server kafka11:9092 --list
生產(chǎn)一些消息
kafka-console-producer.sh --bootstrap-server kafka11:9092 --topic demo
消費(fèi)一些消息
kafka-console-consumer.sh --bootstrap-server kafka11:9092 --topic demo
制造一些假數(shù)據(jù)
kafka-producer-perf-test.sh --topic demo --record-size 1024 --num-records 1000000 --throughput 10000 --producer-props bootstrap.servers=kafka11:9092 batch.size=16384 linger.ms=0
測(cè)試沒(méi)有問(wèn)題,命令可以使用,到kafka-ui的可視化頁(yè)面查看下,有我們剛剛創(chuàng)建的主題,也有我們制造的假數(shù)據(jù),三個(gè)Kafka節(jié)點(diǎn)沒(méi)有異常,Controller也進(jìn)行了選舉,說(shuō)明我們的Kafka已經(jīng)成功創(chuàng)建并運(yùn)行,還替代了原本Zookeeper的工作,至此,開(kāi)發(fā)環(huán)境搭建完成。
整合Spring Boot應(yīng)用
搭建完了Kafka環(huán)境,現(xiàn)在讓我們整合到Spring Boot中來(lái)使用
創(chuàng)建一個(gè)Maven項(xiàng)目
配置pom.xml:
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
?
<groupId>com.cc</groupId>
<artifactId>kafkaDemo</artifactId>
<version>1.0-SNAPSHOT</version>
?
<parent>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-parent</artifactId>
<version>2.3.4.RELEASE</version>
<relativePath/>
</parent>
?
<dependencies>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
<dependency>
<groupId>org.springframework.kafka</groupId>
<artifactId>spring-kafka</artifactId>
<version>2.3.4.RELEASE</version>
</dependency>
</dependencies>
</project>
新建應(yīng)用程序啟動(dòng)類:
@SpringBootApplication
public class Application {
public static void main(String[] args) {
SpringApplication.run(Application.class, args);
}
}
配置application.yml,去連接Kafka環(huán)境
server:
port: 8888
?
spring:
application:
name: kafkaDemo
?
kafka:
bootstrap-servers: mylocalhost:9192,mylocalhost:9292,mylocalhost:9392
producer:
# 生產(chǎn)者序列化
key-serializer: org.apache.kafka.common.serialization.StringSerializer
value-serializer: org.apache.kafka.common.serialization.StringSerializer
# ack策略
# 0:生產(chǎn)者發(fā)送消息就不管了,效率高,但是容易丟數(shù)據(jù),且沒(méi)有重試機(jī)制
# 1:消息發(fā)送到Leader并落盤(pán)后就返回,如果Leader掛了并且Follower還沒(méi)有同步數(shù)據(jù)就會(huì)丟失數(shù)據(jù)
# -1:消息要所有副本都羅盤(pán)才返回,保證數(shù)據(jù)不丟失(但是有可能重復(fù)消費(fèi))
acks: -1
# 失敗重試次數(shù)
retries: 3
# 批量提交的數(shù)據(jù)大小
batch-size: 16384
# 生產(chǎn)者暫存數(shù)據(jù)的緩沖區(qū)大小
buffer-memory: 33554432
consumer:
key-deserializer: org.apache.kafka.common.serialization.StringDeserializer
value-deserializer: org.apache.kafka.common.serialization.StringDeserializer
# 是否自動(dòng)提交偏移量,如果要手動(dòng)確認(rèn)消息,就要設(shè)置為false
enable-auto-commit: false
# 消費(fèi)消息后間隔多長(zhǎng)時(shí)間提交偏移量(ms)
auto-commit-interval: 100
# 默認(rèn)的消費(fèi)者組,如果不指定就會(huì)用這個(gè)
group-id: mykafka
# kafka意外宕機(jī)時(shí)的消息消費(fèi)策略
# earliest:當(dāng)各分區(qū)下有已提交的offset時(shí),從提交的offset開(kāi)始消費(fèi);無(wú)提交的offset時(shí),從頭開(kāi)始消費(fèi)
# latest:當(dāng)各分區(qū)下有已提交的offset時(shí),從提交的offset開(kāi)始消費(fèi);無(wú)提交的offset時(shí),消費(fèi)新產(chǎn)生的該分區(qū)下的數(shù)據(jù)
# none:topic各分區(qū)都存在已提交的offset時(shí),從offset后開(kāi)始消費(fèi);只要有一個(gè)分區(qū)不存在已提交的offset,則拋出異常
auto-offset-reset: latest
listener:
# 手動(dòng)確認(rèn)消息
ack-mode: manual_immediate
# 消費(fèi)者運(yùn)行的線程數(shù)
concurrency: 2
我們只測(cè)試連接,不演示消息的生產(chǎn)和消費(fèi),現(xiàn)在關(guān)注application.yml配置文件,我們只看這個(gè)配置:
bootstrap-servers: mylocalhost:9192,mylocalhost:9292,mylocalhost:9392
mylocalhost是我在本機(jī)hosts中設(shè)置的IP別名映射,即:mylocalhost=192.168.1.54
9192、9292、9392是kafka集群容器映射 出來(lái)對(duì)外的端口,查看一下docker-compose.yml文件即可明白。
啟動(dòng)程序,應(yīng)用連接Kafka,出現(xiàn)了...JVM...字樣,表示成功連接Kafka。
步驟二:部署到生產(chǎn)環(huán)境上
生產(chǎn)環(huán)境和開(kāi)發(fā)環(huán)境有什么不同呢?不同在我們往往沒(méi)有那么多的IP資源可以對(duì)外開(kāi)放,則需要做Nginx轉(zhuǎn)發(fā)。
比如說(shuō)Kafka集群是在內(nèi)網(wǎng)機(jī)器中部署,最終由一臺(tái)代理機(jī)器轉(zhuǎn)發(fā)Kafka集群,當(dāng)然這個(gè)代理機(jī)器實(shí)際上也是要做負(fù)載均衡的,不然代理機(jī)器掛了整個(gè)集群就無(wú)了,不過(guò)Nginx的負(fù)載均衡不在本文篇幅中。
先來(lái)看看生產(chǎn)環(huán)境的docker-compose.yml:
docker-compose.yml
version: "3"
services:
kafka1:
image: 'bitnami/kafka:3.3.1'
network_mode: mynetwork
container_name: kafka1
user: root
environment:
### 通用配置
# 允許使用kraft,即Kafka替代Zookeeper
- KAFKA_ENABLE_KRAFT=yes
# kafka角色,做broker,也要做controller
- KAFKA_CFG_PROCESS_ROLES=broker,controller
# 指定供外部使用的控制類請(qǐng)求信息
- KAFKA_CFG_CONTROLLER_LISTENER_NAMES=CONTROLLER
# 定義kafka服務(wù)端socket監(jiān)聽(tīng)端口
- KAFKA_CFG_LISTENERS=PLAINTEXT://:17005,CONTROLLER://:9093
# 定義安全協(xié)議
- KAFKA_CFG_LISTENER_SECURITY_PROTOCOL_MAP=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
# 集群地址
- KAFKA_CFG_CONTROLLER_QUORUM_VOTERS=1@kafka1:9093,2@kafka2:9093,3@kafka3:9093
# 允許使用PLAINTEXT監(jiān)聽(tīng)器,默認(rèn)false,不建議在生產(chǎn)環(huán)境使用
- ALLOW_PLAINTEXT_LISTENER=yes
# 設(shè)置broker最大內(nèi)存,和初始內(nèi)存
- KAFKA_HEAP_OPTS=-Xmx512M -Xms256M
# 不允許自動(dòng)創(chuàng)建主題
- KAFKA_CFG_AUTO_CREATE_TOPICS_ENABLE=false
# 使用Kafka時(shí)的集群id,集群內(nèi)的Kafka都要用這個(gè)id做初始化,生成一個(gè)UUID即可
- KAFKA_KRAFT_CLUSTER_ID=LelM2dIFQkiUFvXCEcqRWA
?
### broker配置
# 定義外網(wǎng)訪問(wèn)地址(宿主機(jī)ip地址和端口)
- KAFKA_CFG_ADVERTISED_LISTENERS=PLAINTEXT://kafka1:17005
# broker.id,必須唯一
- KAFKA_BROKER_ID=1
volumes:
- /home/mycontainers/kafka1/kafka/kraft:/bitnami/kafka
kafka2:
image: 'bitnami/kafka:3.3.1'
network_mode: mynetwork
container_name: kafka2
user: root
environment:
### 通用配置
# 允許使用kraft,即Kafka替代Zookeeper
- KAFKA_ENABLE_KRAFT=yes
# kafka角色,做broker,也要做controller
- KAFKA_CFG_PROCESS_ROLES=broker,controller
# 指定供外部使用的控制類請(qǐng)求信息
- KAFKA_CFG_CONTROLLER_LISTENER_NAMES=CONTROLLER
# 定義kafka服務(wù)端socket監(jiān)聽(tīng)端口
- KAFKA_CFG_LISTENERS=PLAINTEXT://:17005,CONTROLLER://:9093
# 定義安全協(xié)議
- KAFKA_CFG_LISTENER_SECURITY_PROTOCOL_MAP=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
# 集群地址
- KAFKA_CFG_CONTROLLER_QUORUM_VOTERS=1@kafka1:9093,2@kafka2:9093,3@kafka3:9093
# 允許使用PLAINTEXT監(jiān)聽(tīng)器,默認(rèn)false,不建議在生產(chǎn)環(huán)境使用
- ALLOW_PLAINTEXT_LISTENER=yes
# 設(shè)置broker最大內(nèi)存,和初始內(nèi)存
- KAFKA_HEAP_OPTS=-Xmx512M -Xms256M
# 不允許自動(dòng)創(chuàng)建主題
- KAFKA_CFG_AUTO_CREATE_TOPICS_ENABLE=false
# 使用Kafka時(shí)的集群id,集群內(nèi)的Kafka都要用這個(gè)id做初始化,生成一個(gè)UUID即可
- KAFKA_KRAFT_CLUSTER_ID=LelM2dIFQkiUFvXCEcqRWA
?
### broker配置
# 定義外網(wǎng)訪問(wèn)地址(宿主機(jī)ip地址和端口)
- KAFKA_CFG_ADVERTISED_LISTENERS=PLAINTEXT://kafka2:17005
# broker.id,必須唯一
- KAFKA_BROKER_ID=2
?
volumes:
- /home/mycontainers/kafka2/kafka/kraft:/bitnami/kafka
kafka3:
image: 'bitnami/kafka:3.3.1'
network_mode: mynetwork
container_name: kafka3
user: root
environment:
### 通用配置
# 允許使用kraft,即Kafka替代Zookeeper
- KAFKA_ENABLE_KRAFT=yes
# kafka角色,做broker,也要做controller
- KAFKA_CFG_PROCESS_ROLES=broker,controller
# 指定供外部使用的控制類請(qǐng)求信息
- KAFKA_CFG_CONTROLLER_LISTENER_NAMES=CONTROLLER
# 定義kafka服務(wù)端socket監(jiān)聽(tīng)端口
- KAFKA_CFG_LISTENERS=PLAINTEXT://:17005,CONTROLLER://:9093
# 定義安全協(xié)議
- KAFKA_CFG_LISTENER_SECURITY_PROTOCOL_MAP=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
# 集群地址
- KAFKA_CFG_CONTROLLER_QUORUM_VOTERS=1@kafka1:9093,2@kafka2:9093,3@kafka3:9093
# 允許使用PLAINTEXT監(jiān)聽(tīng)器,默認(rèn)false,不建議在生產(chǎn)環(huán)境使用
- ALLOW_PLAINTEXT_LISTENER=yes
# 設(shè)置broker最大內(nèi)存,和初始內(nèi)存
- KAFKA_HEAP_OPTS=-Xmx512M -Xms256M
# 不允許自動(dòng)創(chuàng)建主題
- KAFKA_CFG_AUTO_CREATE_TOPICS_ENABLE=false
# 使用Kafka時(shí)的集群id,集群內(nèi)的Kafka都要用這個(gè)id做初始化,生成一個(gè)UUID即可
- KAFKA_KRAFT_CLUSTER_ID=LelM2dIFQkiUFvXCEcqRWA
?
### broker配置
# 定義外網(wǎng)訪問(wèn)地址(宿主機(jī)ip地址和端口)
- KAFKA_CFG_ADVERTISED_LISTENERS=PLAINTEXT://kafka3:17005
# broker.id,必須唯一
- KAFKA_BROKER_ID=3
volumes:
- /home/mycontainers/kafka3/kafka/kraft:/bitnami/kafka
注意,這里我們的容器名是kafka1、kafka2、kafka3,和開(kāi)發(fā)環(huán)境有所區(qū)別。
接下來(lái)是重點(diǎn)部分,要理解重點(diǎn)配置才可以正常使用,生產(chǎn)環(huán)境這部分我花了兩天才搞通。
docker-compose配置文件變化部分以及說(shuō)明
先重新聲明一些題要:
- 開(kāi)發(fā)機(jī)的IP是:192.168.1.10
- 開(kāi)發(fā)環(huán)境的虛擬機(jī)IP是:192.168.1.54(與開(kāi)發(fā)機(jī)同網(wǎng)絡(luò))
- Kafka集群處于內(nèi)網(wǎng)環(huán)境,比如公司的內(nèi)部服務(wù)器,無(wú)法對(duì)外訪問(wèn)
- 云服務(wù)器的IP是:a.a.a.a(自行腦補(bǔ)),云服務(wù)器就是代理服務(wù)器,可以訪問(wèn)Kafka集群服務(wù)
- 開(kāi)發(fā)環(huán)境的Kafka容器名是:kafka11、kafka22、kafka33
- 生產(chǎn)環(huán)境的Kafka容器名是:kafka1、kafka2、kafka3
接下來(lái)對(duì)生產(chǎn)環(huán)境的配置變動(dòng)進(jìn)行說(shuō)明:
- 去掉端口映射,因?yàn)槲覀兊葧?huì)會(huì)創(chuàng)建一個(gè)Ngnix容器來(lái)轉(zhuǎn)發(fā),容器間已經(jīng)可以進(jìn)行通訊,所以就不需要對(duì)外端口了,除非這個(gè)Nginx容器是另外一臺(tái)機(jī)器上,那么就需要對(duì)外端口。
- KAFKA_CFG_ADVERTISED_LISTENERS的外網(wǎng)訪問(wèn)地址從實(shí)際IP改成了kafka1:17005, 在開(kāi)發(fā)環(huán)境中,我們的開(kāi)發(fā)機(jī)子可以通過(guò)虛擬機(jī)IP來(lái)訪問(wèn)容器,所以配置192.168.1.54,但是生產(chǎn)環(huán)境這里我們不能直接訪問(wèn)了(假設(shè)生產(chǎn)環(huán)境的Kafka集群是在內(nèi)網(wǎng)),我們只能訪問(wèn)代理服務(wù)器,讓代理服務(wù)器幫忙轉(zhuǎn)發(fā)請(qǐng)求,所以這里改的:kafka1:17005,必須是代理服務(wù)器可以訪問(wèn)到的,因?yàn)槲覀兇矸?wù)器和生產(chǎn)環(huán)境的Kafka集群是同一個(gè)容器組內(nèi),所以可以訪問(wèn),這是為了便于演示,實(shí)際上代理服務(wù)器和Kafka集群肯定不會(huì)在同一臺(tái)機(jī)器內(nèi),所以就不能用:kafka1:17005,而是要用:[代理服務(wù)器可以訪問(wèn)到的Kafka集群地址]:17005
- 17005端口替換原來(lái)的9092端口,因?yàn)槲业脑品?wù)器安全組沒(méi)有開(kāi)放9092,所以改成17005,這個(gè)端口要和等會(huì)轉(zhuǎn)發(fā)用的Nginx端口保持一致,即Nginx容器也要開(kāi)放17005端口
啟動(dòng)Nginx容器
nginx.yml:
version: "3"
services:
nginx:
image: nginx:latest
network_mode: mynetwork
container_name: nginx
restart: always
ports:
- 17005:9092
volumes:
- /etc/localtime:/etc/localtime
- /home/mycontainers/nginx/nginx.conf:/etc/nginx/nginx.conf
- /home/mycontainers/nginx/logs:/var/log/nginx
- /home/mycontainers/nginx/conf.d/:/etc/nginx/conf.d
手動(dòng)修改nginx.conf:
stream {
upstream kafka {
server kafka1:17005;
server kafka2:17005;
server kafka3:17005;
}
?
server {
listen 9092;
proxy_pass kafka;
}
}
?
http {
...
location / {
...
}
...
}
啟動(dòng)Nginx容器后,修改一下配置,將Kaka集群配置進(jìn)來(lái),然后監(jiān)聽(tīng)9092端口進(jìn)行轉(zhuǎn)發(fā),當(dāng)然端口可以定制,這個(gè)不重要,重要的是Nginx容器對(duì)外的17005端口,流程是這樣的:
- 外部訪問(wèn)17005端口,映射到Nginx的9092端口
- Nginx的9092端口對(duì)應(yīng)了Kafka的集群,Kafka集群的端口是17005,所以Nginx的對(duì)外也要是17005,這樣要保證強(qiáng)一致
至此,生產(chǎn)環(huán)境搭建完成。
最后一步:IP別名映射的重要性
還記得上面搭建開(kāi)發(fā)環(huán)境時(shí)候先注釋掉的extra_hosts配置嗎:
# 剛剛我們有進(jìn)行聲明,云服務(wù)器IP是a.a.a.a,所以去掉注釋,自行替換
extra_hosts:
- "kafka1:云服務(wù)器IP"
- "kafka2:云服務(wù)器IP"
- "kafka3:云服務(wù)器IP"
現(xiàn)在用上了,這個(gè)只配置到了開(kāi)發(fā)環(huán)境的kafka11容器中,kafka22是沒(méi)有的,我們先進(jìn)入kafka22容器中去連接生產(chǎn)環(huán)境的Kafka集群看看:
進(jìn)入kafka22容器
docker exec -it kafka22 bash
連接生產(chǎn)環(huán)境的Kafka集群(通過(guò)Nginx轉(zhuǎn)發(fā))
kafka-topics.sh --bootstrap-server a.a.a.a:17005 --list
會(huì)報(bào)錯(cuò):
[2023-01-11 07:29:07,495] WARN [AdminClient clientId=adminclient-1] Error connecting to node kafka3:17005 (id: 3 rack: null) (org.apache.kafka.clients.NetworkClient)
java.net.UnknownHostException: kafka3
at java.base/java.net.InetAddress$CachedAddresses.get(InetAddress.java:797)
at java.base/java.net.InetAddress.getAllByName0(InetAddress.java:1519)
at java.base/java.net.InetAddress.getAllByName(InetAddress.java:1378)
at java.base/java.net.InetAddress.getAllByName(InetAddress.java:1306)
at org.apache.kafka.clients.DefaultHostResolver.resolve(DefaultHostResolver.java:27)
at org.apache.kafka.clients.ClientUtils.resolve(ClientUtils.java:110)
at org.apache.kafka.clients.ClusterConnectionStates$NodeConnectionState.currentAddress(ClusterConnectionStates.java:510)
at org.apache.kafka.clients.ClusterConnectionStates$NodeConnectionState.access$200(ClusterConnectionStates.java:467)
at org.apache.kafka.clients.ClusterConnectionStates.currentAddress(ClusterConnectionStates.java:173)
at org.apache.kafka.clients.NetworkClient.initiateConnect(NetworkClient.java:990)
at org.apache.kafka.clients.NetworkClient.ready(NetworkClient.java:301)
at org.apache.kafka.clients.admin.KafkaAdminClient$AdminClientRunnable.sendEligibleCalls(KafkaAdminClient.java:1143)
at org.apache.kafka.clients.admin.KafkaAdminClient$AdminClientRunnable.processRequests(KafkaAdminClient.java:1403)
at org.apache.kafka.clients.admin.KafkaAdminClient$AdminClientRunnable.run(KafkaAdminClient.java:1346)
at java.base/java.lang.Thread.run(Thread.java:829)
可以看到關(guān)鍵字:kafka3:17005,在開(kāi)發(fā)環(huán)境中連接生產(chǎn)環(huán)境報(bào)這個(gè)kafka3,而kafka3是在生產(chǎn)環(huán)境中配置的,我們開(kāi)發(fā)環(huán)境配置的是kafka33,所以很明顯,在連接Kafka的時(shí)候,會(huì)自動(dòng)去讀取集群地址,就是我們生產(chǎn)環(huán)境的docker-compose.yml中的:
- KAFKA_CFG_CONTROLLER_QUORUM_VOTERS=1@kafka1:9093,2@kafka2:9093,3@kafka3:9093
雖然Kafka集群運(yùn)行起來(lái)了,Nginx轉(zhuǎn)發(fā)成功了,但是實(shí)際連接不上,因?yàn)椴恢肋@個(gè)kafka3是什么意思,所以我們還需要做最后一步:IP別名映射
extra_hosts配置
退出kafka22容器,恢復(fù)kafka11容器的extra_hosts配置:
extra_hosts:
- "kafka1:a.a.a.a"
- "kafka2:a.a.a.a"
- "kafka3:a.a.a.a"
重新啟動(dòng)開(kāi)發(fā)環(huán)境的Kafka容器,然后進(jìn)入kafka11容器去連接生產(chǎn)環(huán)境,這時(shí)候就成功了,因?yàn)闀?huì)把kafka1、kafka2、kafka3都映射到a.a.a.a即代理服務(wù)器的公網(wǎng)IP,所以至此,生產(chǎn)環(huán)境搭建完成。
開(kāi)發(fā)機(jī)修改hosts
我們現(xiàn)在知道,連接生產(chǎn)環(huán)境的Kafka獲取的集群地址是kafka1、kafka2、kafka3,所以在開(kāi)發(fā)機(jī)中我們同樣需要修改hosts配置,映射實(shí)際的公網(wǎng)IP,不然無(wú)法識(shí)別。
以上就是詳細(xì)講解Docker-Compose部署Kafka KRaft集群環(huán)境的詳細(xì)內(nèi)容,更多關(guān)于Docker Compose部署Kafka KRaft的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
基于Docker+Jenkins實(shí)現(xiàn)自動(dòng)化部署的方法
這篇文章主要介紹了基于Docker+Jenkins實(shí)現(xiàn)自動(dòng)化部署,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-07-07
解決Jenkins集成docker插件問(wèn)題的一些方法
本文主要介紹了Jenkins集成docker插件問(wèn)題的一些方法,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-10-10
Docker容器網(wǎng)絡(luò)基礎(chǔ)概述
這篇文章主要介紹了Docker容器網(wǎng)絡(luò)基礎(chǔ)概述,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-09-09
docker內(nèi)的容器如何與宿主機(jī)共享IP的方法
本文主要介紹了docker內(nèi)的容器如何與宿主機(jī)共享IP的方法,文中根據(jù)實(shí)例編碼詳細(xì)介紹的十分詳盡,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-03-03
Docker跨平臺(tái)和環(huán)境部署的過(guò)程詳解
Docker是一個(gè)開(kāi)放源代碼的容器化平臺(tái),它能夠?qū)崿F(xiàn)應(yīng)用及其依賴的打包,從而實(shí)現(xiàn)跨平臺(tái)和環(huán)境的快速部署,本文介紹了Docker的基本概念、優(yōu)勢(shì)和基本使用方法,包括安裝、啟動(dòng)、構(gòu)建鏡像和部署應(yīng)用等步驟2024-11-11
Docker使用nodejs鏡像構(gòu)建express服務(wù)的方法
這篇文章主要介紹了Docker使用nodejs鏡像構(gòu)建express服務(wù),主要包括nodejs容器的啟動(dòng),安裝nodejs第三方依賴模塊及啟動(dòng)nodejs服務(wù)的相關(guān)操作,本文給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-07-07
docker-compose啟動(dòng)mysql雙機(jī)熱備互為主從的方法實(shí)現(xiàn)
本文主要介紹了docker-compose啟動(dòng)mysql雙機(jī)熱備互為主從的方法實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-07-07
從零搭建docker+jenkins+node.js自動(dòng)化部署環(huán)境的方法
這篇文章主要介紹了從零搭建docker+jenkins+node.js自動(dòng)化部署環(huán)境的方法,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-01-01

