'데이터 엔지니어'로 성장하기

정리하는 걸 좋아하고, 남이 읽으면 더 좋아함

기타/K8S 35

Grafana) helm grafana admin 비밀번호 초기화 해결

argocd와 helm으로 grafana를 실행했는데 자꾸 admin 비밀번호가 변경되더라고요. 임시로 비밀번호를 초기화하는 방법도 있지만, 고정하는 방법에 대해 찾아봤습니다. 이 글의 예상 독자는 아래와 같아요 1. 비밀번호 계속 바껴서 불편하신분 2. 임시 방편이 아니라, 고정을 원하시는분 grafana의 admin 비밀번호는 secret에 admin-password에 저장이되요 하지만 argocd를 사용할 경우 계속 새로고침되면서 비밀번호가 변경됩니다. kubectl get secret --namespace default grafana -o jsonpath="{.data.admin-password}" | base64 --decode ; echo > DpveUuOyxNrandompasswordYuB5..

기타/K8S 2022.10.20

(Helm) helm3 upgrade failed 이슈

helm 사용하다가 helm upgrade가 안되는 문제가 발생했어요 Upgrade "airflow" failed: cannot patch "airflow" with kind PersistentVolumeClaim: PersistentVolumeClaim "grafana" is invalid: spec: Forbidden: is immutable after creation except resources.requests for bound claims 검색해보니, helm3는 deployment 내역을 secret으로 관리한데요 Since Helm 3, Helm supports three-way merge patch strategy², which makes it safer to bypass the error..

기타/K8S 2022.08.01

K8s) host명으로 내부 데이터 접근하기_spark,boto3,k8s

IP로 데이터에 접근하다보니, 불안해서 host명으로 수정했어요 k8s에서 작업하시는 분들께 도움이 되었으면 합니다 :) 요약 문제 : IP로 데이터 접근하니, 보안 리스크가 생김 상황 : spark image, jupyterhub, airflow 에 적용가능함 조치 : IP를 host명으로 대체함 결론 : 보안 리스크 줄이고, cluster 관리가 편해짐 설명 1. 문제 data에 IP로 접근해서 생길 수 있는 보안 이슈 발견 k8s cluster를 여러개 관리하다보니까, IP가 이제 꼬이기 시작했어요. 보안 이슈도 있었지만, 곧 신규 cluster 구축이 예정되어있어서 미리 변경하고 싶었어요 제가 편해야 시스템도 안정적으로 변하니까요ㅎ 2. 상황 일단 3가지 먼저, spark image/ jupyte..

기타/K8S 2022.07.07

Kubernetes) 자주 사용하는 명령어_메모용

내가 자주 사용하는 명령어 # 특정 pod 지우기 kubectl delete pods --field-selector status.phase=Failed -n mlflow kubectl delete pods --field-selector status.phase=Succeeded -n mlflow kubectl delete pods --field-selector status.phase=Pending -n mlflow #과거 replicaset 지우기 kubectl delete replicaset -n jhub $(kubectl get replicaset -n jhub | grep "0 0 0"| cut -d' ' -f 1) #ns 강제로 지우기 kubectl get namespace "rook-ceph" -..

기타/K8S 2022.04.26

kubernetes) Kubesphere 제거시 남는 것들_helm,ulimit

한줄 요약: kubesphere 삭제할 때 정말 잘 지워졌는지 확인하자 요약 문제발생 linux max user process 부족으로 master에 오류가 생김 원인 파악 설정된 max user process 자체가 너무 작음 sendmail, postdrop, etcd-backup.sh 관련된 프로세스가 생김 해결 방안 ulimit 변경 후 reboot 요청 Kubesphere 관련 설정 마저 삭제 설명 1. 문제 발생 > linux max user process 부족으로 master에 오류가 생김 아래는 예시 $k get pod -n jupyter runtime: failed to create new OS thread (have 16 already; errno=11) runtime: may need..

기타/K8S 2022.04.09

udemy)CKA 강의 듣고 따라하기_7장_security :: mightytedkim

udemy)CKA 강의 듣고 따라하기_7장_security + 후기 수강기간 : 0908- (수강 전) 보안 부분은 2시간 20분이나 됨ㅜ 잘 모르는 분야라 무섭기도하고 결국 넘어야할 중요한 부분이라 정신 바짝차리고, 이번주 주말에 완강하는 걸 목표로 해야겠다. 다행히 아주 기초 단계로 설명해준다고 한다. (수강 후) Section 7: Security 0 / 33 | 2hr 21min 132. Security - Section Introduction 2min > 개요 설명 어떻게 사용자가 접근하고, 관리되는지 기본 설정을 예시를 통해 보고, tls certicate 등을 볼 예정 아주 기초부터 볼거기 때문에 많은 시간이 걸리게 구성이됨 133. Download Presentation Deck 1min ..

기타/K8S 2022.04.08

udemy)CKA 강의 듣고 따라하기_6장_cluster mng :: mightytedkim

udemy)CKA 강의 듣고 따라하기_6장_cluster mng + 후기 수강 기간: 20220402-0406(5일) (수강 전) 실제 온프렘에서 k8s cluster를 운영하고 있기 때문에 재미있을 것 같다 ㅎㅎ 생각보다 빡시다. 하지만 언제 이런 정보 얻겠나 싶어서 재미있게 들음 (수강 후) 마침 etcdctl 관련 이슈가 있어서, 정보가 필요했는데 이 강의를 들어서 이해되기 시작했다. 여러번 돌려들을 정도로 꼼꼼하게 들었고 지금까지 강의 중에서 제일 재미있었다. - master, worker 업그레이드하는 과정에서 drain, cordon, uncordon - etcdctl snapshot save, restore Section 6: Cluster Maintenance | 1hr 11min 115...

기타/K8S 2022.04.03

udemy)CKA 강의 듣고 따라하기_5장_lifecycle :: mightytedkim

CKA 강의 듣고 따라하기_5장_application lifecycle management + 후기 수강 기간: 20220330~20220402(4일) 1시간 30분짜리 챕터지만 목차상으로는 어려워보이는 것은 없을 것 같음 1. rollout은 히스토리 관리할 수 있어서 좋은듯 2. docker의 cmd, entrypoint 개념 복습해서 좋음 3. configmap, secret 적용하는법 복습 4. initcontainer의 개념 Course content Section 1: Introduction 7 / 7 | 20min : 강의 개요 Section 2: Core Concepts 40 / 40 | 2hr 57min : 기본 오브젝트 설명 Section 3: Scheduling 31 / 31 | 1h..

기타/K8S 2022.03.31

udemy)CKA 강의 듣고 따라하기_4장_Logging,Monitoring:: mightytedkim

CKA 강의 듣고 따라하기_4장_Logging,Monitoring + 후기 수강기간: 20220329 (1일) 그라파나로 온갖 노가다로 만든 대시보드가 기억난다. 13분이면 정말 기본만 다룰 것 같아서 약간 아쉽다 역시 metrics-sever부분만 살짝 다룬다. log도 단순 명령어를 보여줌. 굳이 챕터를 나눴어야했나 싶음 79. Logging and Monitoring Section Introduction 1min > 개요 설명 80. Download Presentation Deck 1min > 문서 공유 81. Monitor Cluster Components 4min > metrics-server 는 따로 설치해야된다고 알려줌 상태를 확인해야하기 위해서는 cpu, memory 를 확인할 솔루션이 필..

기타/K8S 2022.03.29

udemy)CKA 강의 듣고 따라하기_3장_scheduling :: mightytedkim

CKA 강의 듣고 따라하기_3장_scheduling 이번 장은 scheduling 부분 예전 부터 궁금했던 부분이라 재밌을 것 같음 ㅎㅎ + 후기 수강기간 : 20220326-27(2일) 몰랐던 개념들을 공부하기 시작! node affinity, taint, tolerations,daemonset,scheduler 등등 특히 node에 할당하는 tain/toleration, nodeaffinity 사용만하고 왜 필요한지 몰랐던 daemonset 잘보지않았떤 scheduler를 더 깊이 볼 수 있어서 의미있었다 주말은 없어졌지만, 재미있닼 Section 3: Scheduling 2 / 31 | 1hr 50min 48. Scheduling Section Introduction 1min 49. Download..

기타/K8S 2022.03.26