新聞中心
【云原生】K8S pod 動(dòng)態(tài)彈性擴(kuò)縮容 HPA
作者:liugp 2023-02-08 07:55:33
云計(jì)算
云原生 對(duì)于自定義指標(biāo),將使用 custom.metrics.k8s.io API。它由其他度量指標(biāo)方案廠商的“適配器(Adapter)” API 服務(wù)器提供。檢查你的指標(biāo)管道以查看是否有可用的 Kubernetes 指標(biāo)適配器。

一、概述
Horizontal Pod Autoscaler(HPA?,Pod水平自動(dòng)伸縮),根據(jù)平均 CPU 利用率、平均內(nèi)存利用率或你指定的任何其他自定義指標(biāo)自動(dòng)調(diào)整 Deployment? 、ReplicaSet? 或 StatefulSet? 或其他類(lèi)似資源,實(shí)現(xiàn)部署的自動(dòng)擴(kuò)展和縮減,讓部署的規(guī)模接近于實(shí)際服務(wù)的負(fù)載。HPA不適用于無(wú)法縮放的對(duì)象,例如DaemonSet。
官方文檔:https://kubernetes.io/zh-cn/docs/tasks/run-application/horizontal-pod-autoscale/
實(shí)際生產(chǎn)中,一般使用這四類(lèi)指標(biāo):
- Resource metrics——CPU核 和 內(nèi)存利用率指標(biāo)。
- Pod metrics——例如網(wǎng)絡(luò)利用率和流量。
- Object metrics——特定對(duì)象的指標(biāo),比如Ingress, 可以按每秒使用請(qǐng)求數(shù)來(lái)擴(kuò)展容器。
- Custom metrics——自定義監(jiān)控,比如通過(guò)定義服務(wù)響應(yīng)時(shí)間,當(dāng)響應(yīng)時(shí)間達(dá)到一定指標(biāo)時(shí)自動(dòng)擴(kuò)容。
二、安裝 metrics-server
1)HPA 前提條件
默認(rèn)情況下,Horizontal Pod Autoscaler 控制器會(huì)從一系列的 API 中檢索度量值。集群管理員需要確保下述條件,以保證 HPA 控制器能夠訪問(wèn)這些 API:
- 對(duì)于資源指標(biāo),將使用 metrics.k8s.io API,一般由 metrics-server 提供。它可以作為集群插件啟動(dòng)。
- 對(duì)于自定義指標(biāo),將使用 custom.metrics.k8s.io API。它由其他度量指標(biāo)方案廠商的“適配器(Adapter)” API 服務(wù)器提供。檢查你的指標(biāo)管道以查看是否有可用的 Kubernetes 指標(biāo)適配器。
- 對(duì)于外部指標(biāo),將使用 external.metrics.k8s.io API。可能由上面的自定義指標(biāo)適配器提供。
Kubernetes Metrics Server:
- Kubernetes Metrics Server 是 Cluster 的核心監(jiān)控?cái)?shù)據(jù)的聚合器,kubeadm 默認(rèn)是不部署的。
- Metrics Server 供 Dashboard 等其他組件使用,是一個(gè)擴(kuò)展的 APIServer,依賴(lài)于 API Aggregator。所以,在安裝 Metrics Server 之前需要先在 kube-apiserver 中開(kāi)啟 API Aggregator。
- Metrics API 只可以查詢(xún)當(dāng)前的度量數(shù)據(jù),并不保存歷史數(shù)據(jù)。
- Metrics API URI 為 /apis/metrics.k8s.io/,在 k8s.io/metrics 下維護(hù)。
- 必須部署 metrics-server 才能使用該 API,metrics-server 通過(guò)調(diào)用 kubelet Summary API 獲取數(shù)據(jù)。
2)開(kāi)啟 API Aggregator
# 添加這行
# --enable-aggregator-routing=true
### 修改每個(gè) API Server 的 kube-apiserver.yaml 配置開(kāi)啟 Aggregator Routing:修改 manifests 配置后 API Server 會(huì)自動(dòng)重啟生效。
cat /etc/kubernetes/manifests/kube-apiserver.yaml
3)開(kāi)始安裝 metrics-server
GitHub地址:https://github.com/kubernetes-sigs/metrics-server/releases下載
wget https://github.com/kubernetes-sigs/metrics-server/releases/download/metrics-server-helm-chart-3.8.2/components.yaml
修改
...
template:
metadata:
labels:
k8s-app: metrics-server
spec:
containers:
- args:
- --cert-dir=/tmp
- --secure-port=4443
- --kubelet-preferred-address-types=InternalIP,ExternalIP,Hostname
- --kubelet-use-node-status-port
- --kubelet-insecure-tls # 加上該啟動(dòng)參數(shù),不加可能會(huì)報(bào)錯(cuò)
image: registry.aliyuncs.com/google_containers/metrics-server:v0.6.1 # 鏡像地址根據(jù)情況修改
imagePullPolicy: IfNotPresent
...
metrics-server pod無(wú)法啟動(dòng),出現(xiàn)日志unable to fully collect metrics: ... x509: cannot validate certificate for because ... it doesn't contain any IP SANs ...?解決方法:在metrics-server中添加--kubelet-insecure-tls參數(shù)跳過(guò)證書(shū)校驗(yàn)
開(kāi)始安裝
kubectl apply -f components.yaml
kubectl get pod -n kube-system | grep metrics-server
# 查看
kubectl get pod -n kube-system | grep metrics-server
# 查看node和pod資源使用情況
kubectl top nodes
kubectl top pods
三、Horizontal Pod Autoscaler 工作原理
1)原理架構(gòu)圖
- 自動(dòng)檢測(cè)周期由 kube-controller-manager 的 --horizontal-pod-autoscaler-sync-period 參數(shù)設(shè)置(默認(rèn)間隔為 15 秒)。
- metrics-server 提供 metrics.k8s.io API 為pod資源的使用提供支持。
- 15s/周期 -> 查詢(xún)metrics.k8s.io API -> 算法計(jì)算 -> 調(diào)用scale 調(diào)度 -> 特定的擴(kuò)縮容策略執(zhí)行。
2)HPA擴(kuò)縮容算法
從最基本的角度來(lái)看,Pod 水平自動(dòng)擴(kuò)縮控制器根據(jù)當(dāng)前指標(biāo)和期望指標(biāo)來(lái)計(jì)算擴(kuò)縮比例。
期望副本數(shù) = ceil[當(dāng)前副本數(shù) * (當(dāng)前指標(biāo) / 期望指標(biāo))]
1、擴(kuò)容
- 如果計(jì)算出的擴(kuò)縮比例接近 1.0, 將會(huì)放棄本次擴(kuò)縮, 度量指標(biāo) / 期望指標(biāo)接近1.0。
2、縮容
- 冷卻/延遲: 如果延遲(冷卻)時(shí)間設(shè)置的太短,那么副本數(shù)量有可能跟以前一樣出現(xiàn)抖動(dòng)。默認(rèn)值是 5 分鐘(5m0s)--horizontal-pod-autoscaler-downscale-stabilization
3、特殊處理
- 丟失度量值:縮小時(shí)假設(shè)這些 Pod 消耗了目標(biāo)值的 100%, 在需要放大時(shí)假設(shè)這些 Pod 消耗了 0% 目標(biāo)值。這可以在一定程度上抑制擴(kuò)縮的幅度。
- 存在未就緒的pod的時(shí)候:我們保守地假設(shè)尚未就緒的 Pod 消耗了期望指標(biāo)的 0%,從而進(jìn)一步降低了擴(kuò)縮的幅度。
- 未就緒的 Pod 和缺少指標(biāo)的 Pod 考慮進(jìn)來(lái)再次計(jì)算使用率。如果新的比率與擴(kuò)縮方向相反,或者在容忍范圍內(nèi),則跳過(guò)擴(kuò)縮。否則,我們使用新的擴(kuò)縮比例。
- 指定了多個(gè)指標(biāo), 那么會(huì)按照每個(gè)指標(biāo)分別計(jì)算擴(kuò)縮副本數(shù),取最大值進(jìn)行擴(kuò)縮。
3)HPA 對(duì)象定義
apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
name: nginx
spec:
behavior:
scaleDown:
policies:
- type: Pods
value: 4
periodSeconds: 60
- type: Percent
value: 10
periodSeconds: 60
stabilizationWindowSeconds: 300
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: nginx
minReplicas: 1
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 50
HPA對(duì)象默認(rèn)行為
behavior:
scaleDown:
stabilizationWindowSeconds: 300
policies:
- type: Percent
value: 100
periodSeconds: 15
scaleUp:
stabilizationWindowSeconds: 0
policies:
- type: Percent
value: 100
periodSeconds: 15
- type: Pods
value: 4
periodSeconds: 15
selectPolicy: Max
四、示例演示
1)編排yaml
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: hpa-nginx
spec:
maxReplicas: 10 # 最大擴(kuò)容到10個(gè)節(jié)點(diǎn)(pod)
minReplicas: 1 # 最小擴(kuò)容1個(gè)節(jié)點(diǎn)(pod)
metrics:
- resource:
name: cpu
target:
averageUtilization: 40 # CPU 平局資源使用率達(dá)到40%就開(kāi)始擴(kuò)容,低于40%就是縮容
# 設(shè)置內(nèi)存
# AverageValue:40
type: Utilization
type: Resource
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: hpa-nginx
---
apiVersion: v1
kind: Service
metadata:
name: hpa-nginx
spec:
type: NodePort
ports:
- name: "http"
port: 80
targetPort: 80
nodePort: 30080
selector:
service: hpa-nginx
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: hpa-nginx
spec:
replicas: 1
selector:
matchLabels:
service: hpa-nginx
template:
metadata:
labels:
service: hpa-nginx
spec:
containers:
- name: hpa-nginx
image: nginx:latest
resources:
requests:
cpu: 100m
memory: 100Mi
limits:
cpu: 200m
memory: 200Mi
主要參數(shù)解釋如下:
- scaleTargetRef:目標(biāo)作用對(duì)象,可以是Deployment、ReplicationController或ReplicaSet。
- minReplicas和maxReplicas:Pod副本數(shù)量的最小值和最大值,系統(tǒng)將在這個(gè)范圍內(nèi)進(jìn)行自動(dòng)擴(kuò)縮容操作,并維持每個(gè)Pod的內(nèi)存使用率為40%,這個(gè)值就是上面設(shè)置的閾值averageUtilization。
- metrics:目標(biāo)指標(biāo)值。在metrics中通過(guò)參數(shù)type定義指標(biāo)的類(lèi)型;通過(guò)參數(shù)target定義相應(yīng)的指標(biāo)目標(biāo)值,系統(tǒng)將在指標(biāo)數(shù)據(jù)達(dá)到目標(biāo)值時(shí)(考慮容忍度的區(qū)間,見(jiàn)前面算法部分的說(shuō)明)觸發(fā)擴(kuò)縮容操作。
- 對(duì)于CPU使用率,在target參數(shù)中設(shè)置averageUtilization定義目標(biāo)平均CPU使用率。
- 對(duì)于內(nèi)存資源,在target參數(shù)中設(shè)置AverageValue定義目標(biāo)平均內(nèi)存使用值。
執(zhí)行
kubectl apply -f test.yaml
2)使用 ab 工具進(jìn)行壓測(cè)
進(jìn)入apache官網(wǎng) http://httpd.apache.org/ 下載apache即可,或者直接通過(guò)yum安裝apache都行,這里選擇最簡(jiǎn)單的方式y(tǒng)um安裝
yum install httpd -y
開(kāi)始?jí)簻y(cè)
ab -n 100000 -c 800 http://local-168-182-112:30080/
#-c:并發(fā)數(shù)
#-n:總請(qǐng)求數(shù)
? ?
當(dāng)前題目:【云原生】K8s pod 動(dòng)態(tài)彈性擴(kuò)縮容 HPA
文章網(wǎng)址:http://m.5511xx.com/article/cdcsoij.html


咨詢(xún)
建站咨詢(xún)
