CKA考试经验总结

2015 年 8 月 26 日

CKA考试相关说明及经验总结

什么是CKA考试？

CKA全称是Certified Kubernetes Administrator，即Kubernetes认证管理员，由CNCF官方组织考试并颁发证书，应该来说还是比较权威的,还有一个是CKAD考试，对于报考人员的要求更高，主要是基于kubernetes做开发的（比如operator之类），这边我们主要说说CKA考试。

CKA证书的含金量如何？

前两年K8没现在这么火，加上考试费不便宜，考试又很麻烦（需要连国外服务器），这个证书拿的人不多，这两年K8大火，有越来越多的各种xx云和培训机构都在做这个培训，应该说拿证书的难度是大大降低了（培训费很贵）。当然一张证书无法体现一个人的全部能力（其实所有的各种认证证书都是一样的问题），但是有CKA至少说明了你对kubernetes的各种组件、原理、常规操作、简单排障是没有问题了，我觉得是相当于一个入门砖吧，对于工作不久并且有志于从事云原生相关工作的人，还是有积极意义的。而对于企业来说，如果想招聘K8集群管理员，那看这个证书无疑是最方便的，省去了很多能力考察的精力。

考试难度

考试整体难度不算很高，全部是实操类题目，共24题，没有选择题、判断题，考察的是你对于k8的实际应用和操作能力，并不会涉及非常深的底层原理、架构设计思想等。但是题目涉及的范围比较广，相对时间会比较紧张，所以要通过这个考试需要你对于k8的整体功能有一个非常全面的认识。

考试报名

有个好消息是，今年linux基金会的开源软件大学终于落地中国，这样中国的考生就可以方便的在线下考点考试了，从而避免啃爹的网络问题和各种报名、考试环境、摄像头的准备，考官也是中国人，交流非常方便。个人建议如果不是住特别偏远的交通不便，参加线下考试是最佳选择。考试费用是2165元。

线下考点列表： https://training.linuxfoundation.cn/faq#13

报名网址： https://training.linuxfoundation.cn/certificate/details/1

考纲及考试小贴士： https://training.linuxfoundation.cn/faq#15

注意考纲是全英文的，一般以最新的release的k8版本为基础，不过核心的组件和功能最近的版本中变化不大。

考前复习

现在有各种培训机构和云计算公司会针对CKA有专门的培训课程，价格很贵（考试+培训一般都要1万出头），时间其实也就2到3天左右。个人认为除非是你对于k8毫无概念，或者是公司报销费用，否则没有必要去参加这些培训，根据官方考纲复习+看官方文档足够你通过考试了，复习的时候搭建一个简单的k8集群供进行实操，minikube，docker自带的k8，或者像katacoda这样的线上kubernetes playground都是很好的选择。考试的时候是可以查看kubernetes的官方文档网站的，所以对于很多命令、操作不需要死记硬背，只需要知道大致的位置就可以。

目前的考试政策，如果你报名考试没通过（考到75分通过），还会有一次retake的机会，还是比较人性化的，所以我相信只要认真复习通过的问题不会很大。证书有效期为2年，续不续看你们公司的实际需求（CNCF也要赚钱啊），我觉得除非K8架构发生了非常大的改动，或者公司对于资格认定这块有要求，否则也没必要特意去续，能考出来已经证明了你的能力了。

真题解析

这里要感谢简书作者桶装酱油王，下面的题目主要出自他考试过后的整理，原文在这里 https://www.jianshu.com/p/135c1d618a79

1.列出环境内所有的pv 并以 name字段排序（使用kubectl自带排序功能）

kubectl get pv --sort-by=.metadata.name

考点：kubectl命令熟悉程度

2.列出指定pod的日志中状态为Error的行，并记录在指定的文件上

kubectl logs  | grep bash > /opt/KUCC000xxx/KUCC000xxx.txt

考点：Monitor, Log, and Debug

3.列出k8s可用的节点，不包含不可调度的和 NoReachable的节点，并把数字写入到文件里

#笨方法，人工数
kubectl get nodes

#CheatSheet方法，应该还能优化JSONPATH
JSONPATH='{range .items[*]}{@.metadata.name}:{range @.status.conditions[*]}{@.type}={@.status};{end}{end}' \
 && kubectl get nodes -o jsonpath="$JSONPATH" | grep "Ready=True"

考点：kubectl命令熟悉程度(cheatsheet非常重要，最好能熟练掌握)

参考： kubectl cheatsheet

4.创建一个pod名称为nginx，并将其调度到节点为 disk=stat上

#我的操作,实际上从文档复制更快
kubectl run nginx --image=nginx --restart=Never --dry-run > 4.yaml
#增加对应参数
vi 4.yaml
kubectl apply -f 4.yaml

apiVersion: v1
kind: Pod
metadata:
  name: nginx
  labels:
    env: test
spec:
  containers:
  - name: nginx
    image: nginx
    imagePullPolicy: IfNotPresent
  nodeSelector:
    disktype: ssd

考点：pod的调度。

参考： assign-pod-node

5.提供一个pod的yaml，要求添加Init Container，Init Container的作用是创建一个空文件，pod的Containers判断文件是否存在，不存在则退出

apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - name: apline
    image: nginx
    command: ['sh', '-c', 'if [ ! -e "/opt/myfile" ];then exit; fi;']
###增加init Container####
initContainers:
 - name: init
    image: busybox
    command: ['sh', '-c', 'touch /目录/work;']

考点：init Container。一开始审题不仔细，以为要用到livenessProbes

参考： init-containers

6.指定在命名空间内创建一个pod名称为test，内含四个指定的镜像nginx、redis、memcached、busybox

kubectl run test --image=nginx --image=redis --image=memcached --image=buxybox --restart=Never -n

考点：kubectl命令熟悉程度、多个容器的pod的创建

参考： kubectl cheatsheet

7.创建一个pod名称为test，镜像为nginx，Volume名称cache-volume为挂在在/data目录下，且Volume是non-Persistent的

apiVersion: v1
kind: Pod
metadata:
  name: test
spec:
  containers:
  - image: nginx
    name: test-container
    volumeMounts:
    - mountPath: /cache
      name: cache-volume
  volumes:
  - name: cache-volume
    emptyDir: {}

考点：Volume、emptdir

参考： Volumes

8.列出Service名为test下的pod 并找出使用CPU使用率最高的一个，将pod名称写入文件中

#使用-o wide 获取service test的SELECTOR
kubectl get svc test -o wide
##获取结果我就随便造了
NAME              TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)    AGE       SELECTOR
test   ClusterIP   None                 3306/TCP   50d       app=wordpress,tier=mysql

#获取对应SELECTOR的pod使用率，找到最大那个写入文件中
kubectl top pod -l 'app=wordpress,tier=mysql'

考点：获取service selector，kubectl top监控pod资源

参考： Tools for Monitoring Resources

9.创建一个Pod名称为nginx-app，镜像为nginx，并根据pod创建名为nginx-app的Service，type为NodePort

kubectl run nginx-app --image=nginx --restart=Never --port=80
kubectl create svc nodeport nginx-app --tcp=80:80 --dry-run -o yaml > 9.yaml
#修改yaml，保证selector name=nginx-app
vi 9.yaml
apiVersion: v1
kind: Service
metadata:
  creationTimestamp: null
  labels:
    app: nginx-app
  name: nginx-app
spec:
  ports:
  - name: 80-80
    port: 80
    protocol: TCP
    targetPort: 80
  selector:
#注意要和pod对应  
    name: nginx-app
  type: NodePort

考点：Service

参考： publishing-services-service-types

10.创建一个nginx的Workload，保证其在每个节点上运行，注意不要覆盖节点原有的Tolerations

这道题直接复制文档的yaml太长了，由于damonSet的格式和Deployment格式差不多，我用旁门左道的方法 先创建Deploy，再修改，这样速度会快一点

#先创建一个deployment的yaml模板
kubectl run nginx --image=nginx --dry-run -o yaml > 10.yaml
#将yaml改成DaemonSet
vi 10.yaml

#修改apiVersion和kind
#apiVersion: extensions/v1beta1
#kind: Deployment
apiVersion:apps/v1
kind: DaemonSet
metadata:
  creationTimestamp: null
  labels:
    run: nginx
  name: nginx
spec:
#去掉replicas
# replicas: 1
  selector:
    matchLabels:
      run: nginx
  strategy: {}
  template:
    metadata:
      creationTimestamp: null
      labels:
        run: nginx
    spec:
      containers:
      - image: nginx
        name: nginx
        resources: {}
status: {}

考点：DaemonSet

参考： DaemonSet

11.将deployment为nginx-app的副本数从1变成4。

#方法1
kubectl scale  --replicas=4 deployment nginx-app
#方法2，使用edit命令将replicas改成4
kubectl edit deploy nginx-app

考点：deployment的Scaling，搜索Scaling

参考： Scaling the application by increasing the replica count

12.创建nginx-app的deployment ，使用镜像为nginx:1.11.0-alpine ,修改镜像为1.11.3-alpine，并记录升级，再使用回滚，将镜像回滚至nginx:1.11.0-alpine

kubectl run nginx-app --image=nginx:1.11.0-alpine
kubectl set image deployment nginx-app --image=nginx:1.11.3-alpine
kubectl rollout undo deployment nginx-app
kubectl rollout status -w deployment nginx-app

考点：资源的更新

参考： Kubectl Cheat Sheet:Updating Resources

13.根据已有的一个nginx的pod、创建名为nginx的svc、并使用nslookup查找出service dns记录，pod的dns记录并分别写入到指定的文件中

#创建一个服务
kubectl create svc nodeport nginx --tcp=80:80
#创建一个指定版本的busybox，用于执行nslookup
kubectl create -f https://k8s.io/examples/admin/dns/busybox.yaml
#将svc的dns记录写入文件中
kubectl exec -ti busybox -- nslookup nginx > 指定文件
#获取pod的ip地址
kubectl get pod nginx -o yaml
#将获取的pod ip地址使用nslookup查找dns记录
kubectl exec -ti busybox -- nslookup

考点：网络相关，DNS解析

参考： Debugging DNS Resolution

14.创建Secret 名为mysecret，内含有password字段，值为bob，然后在pod1里使用ENV进行调用，Pod2里使用Volume挂载在/data 下

#将密码值使用base64加密,记录在Notepad里
echo -n 'bob' | base64

secret.yaml

apiVersion: v1
kind: Secret
metadata:
  name: mysecret
type: Opaque
data:
  password: Ym9i

pod1.yaml

apiVersion: v1
kind: Pod
metadata:
  name: pod1
spec:
  containers:
  - name: mypod
    image: nginx
    volumeMounts:
    - name: mysecret
      mountPath: "/data"
      readOnly: true
  volumes:
  - name: mysecret
    secret:
      secretName: mysecret

pod2.yaml

apiVersion: v1
kind: Pod
metadata:
  name: pod2
spec:
  containers:
  - name: mycontainer
    image: redis
    env:
      - name: SECRET_PASSWORD
        valueFrom:
          secretKeyRef:
            name: mysecret
            key: password

考点: Secret

参考： Secret

15.使node1节点不可调度，并重新分配该节点上的pod

#直接drain会出错，需要添加--ignore-daemonsets --delete-local-data参数
kubectl drain node node1  --ignore-daemonsets --delete-local-data

考点：节点调度、维护

参考： Safely Drain a Node while Respecting Application SLOs

16.使用etcd 备份功能备份etcd（提供enpoints，ca、cert、key）

ETCDCTL_API=3 etcdctl --endpoints https://127.0.0.1:2379 \
--cacert=ca.pem --cert=cert.pem --key=key.pem \
snapshot save snapshotdb

考点：etcd的集群的备份与恢复

参考： backing up an etcd cluster

17.给出一个失联节点的集群，排查节点故障，要保证改动是永久的。

#查看集群状态
kubectl get nodes
#查看故障节点信息
kubectl describe node node1

#Message显示kubelet无法访问（记不清了）
#进入故障节点
ssh node1

#查看节点中的kubelet进程
ps -aux | grep kubelete
#没找到kubelet进程，查看kubelet服务状态
systemctl status kubelet.service 
#kubelet服务没启动，启动服务并观察
systemctl start kubelet.service 
#启动正常，enable服务
systemctl enable kubelet.service 

#回到考试节点并查看状态
exit

kubectl get nodes #正常

考点：故障排查

参考： Troubleshoot Clusters

18.给出一个集群，排查出集群的故障

这道题没空做完。kubectl get node显示connection refuse，估计是apiserver的故障。

考点：故障排查

参考： Troubleshoot Clusters

19.给出一个节点，完善kubelet配置文件，要求使用systemd配置kubelet

这道题没空做完，

考点我知道，doc没找到··在哪逃~ε=ε=ε=┏(゜ロ゜;)┛

20.给出一个集群，将节点node1添加到集群中，并使用TLS bootstrapping

这道题没空做完，花费时间比较长，可惜了。

考点：TLS Bootstrapping

参考： TLS Bootstrapping

21.创建一个pv，类型是hostPath，位于/data中，大小1G，模式ReadOnlyMany

apiVersion: v1
kind: PersistentVolume
metadata:
  name: pv
spec:
  capacity:
    storage: 1Gi  
  accessModes:
    - ReadOnlyMany
  hostPath:
    path: /data

考点：创建PV

参考： persistent volumes

演道网

CKA考试经验总结

什么是CKA考试？

CKA证书的含金量如何？

考试难度

考试报名

考前复习

真题解析

About The Author

fenny

2025年九月
M	T	W	T	F	S	S
« Jan
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

什么是CKA考试？

CKA证书的含金量如何？

考试难度

考试报名

考前复习

真题解析

Related Posts

About The Author

fenny