'데이터 엔지니어'로 성장하기

정리하는 걸 좋아하고, 남이 읽으면 더 좋아함

인기글

Docker) [해결] dial tcp: lookup docker on *.*.*.*:53: no such host_gitlab-runner

오류 해결 dial tcp: lookup docker on 19.32.192.11:53: no such host 상황 dind 안에서, docker login 안됨 $ docker login -u deet1107 -p ****** WARNING! Using --password via the CLI is insecure. Use --password-stdin. error during connect: Post http://docker:2375/v1.39/auth: dial tcp: lookup docker on **.*.***.**:53: no such host 조치 HTTP 프록시 설정 Variables: HTTPS_PROXY: http://***.219.61.252:8080 HTTP_PROXY: http..

Docker 2021.09.08 0

Kubernetes) k8s와 Airflow 이용한 spark작업_SparkKubernetesOperator

요약 1. kubenetes 환경에서 airflow를 이용해 spark_submit을 함 2. SparkKubernetesOpertor(SKO)를 선택함 개요 상황 쿠버네티스 클러스터 환경에서 spark_submit 관리 필요 후보 (3가지) KubernetePodOperator(KPO) : dag SparkApplication(CRD) : yaml SparkKubernetesOperator(SKO) : yaml + dag 최종 결과 (SKO) command script/scample/sample-sko-spark.yaml dags/sample/sample-sko-spark.py 시행착오 (FYI) SKO) role 권한 때문에 Forbidden 에러 SKO) sensor의 task_id 때문에 에러 S..

Airflow 2021.11.25 14

Harbor) 인증서 설정하기_docker,linux

기본적으로 harbor는 https로 설정이 되어 있다. 처음에 http로 연결하다가, 다른 부분들에서 걸려서 https로 바꿈 CA certificate Harbor가 설치되어 있는 linux에 세팅함 (테스트) ROOT-CA용 crt 생성 crt를 제공받아야하는데, 테스트니까 1. Private key(*.ca.key) 를 만든다. 2. ca.key로 *.ca.crt를 만든다. # openssl을 이용해서 CA certicate 프라이빗 키 생성 openssl genrsa -out ca.key 4096 # CA certifice 생성 openssl req -x509 -new -nodes -sha512 -days 3650 \ -subj "/C=KO/ST=Kim/L=TedO=SK/OU=AI/CN=mydo..

Docker 2021.09.10 0

Linux) 오프라인 apt 설치

온프렘 내부망 세팅하던 중에, 제가 사용하는 apt 들이 없어서 설치했어요 나중에 까먹을까봐 기록해두려고요 환경은 아래와 같아요 - ubuntu 22.04 온라인 - tree, ifconfig, unzip 을 설치했어요 #온라인 다운로드 $ apt-get install --download-only unzip #다운로드 파일 확인 $ ll /var/cache/apt/archives | grep unzip unzip_6.0-26ubuntu3_amd64.deb 오프라인 #파일 복사 $ cd /var/cache/apt/archives $ cp ./etc/util/unzip_6.0-26ubuntu3_amd64.deb /var/cache/apt/archives/ #오프라인 설치 $ sudo dpkg -i unzip..

Linux 2022.11.06 0

Airflow) context, kwargs 혼용 실습

airflow 공부하다가 궁금한게 잇어서, 하나씩 돌려봄 ㅎㅎ 요약 task Context 공부하다가 의문이 생김 테스트 **context, **kwargs 로 두개를 파라미터로 두면 어떻게 될까? execution_date를 변수로 명시하면 사용할 수 있다는데, **context 에서는 그럼 빠지는건가? execution_date 오버라이딩가능할까? 설명 1. task Context 공부하다가 의문이 생김 - execution_date를 변수로 명시하면 사용할 수 있다는데, **context 에서는 그럼 빠지는건가? - **context, **kwargs 로 두개를 파라미터로 두면 어떻게 될까? - execution_date 오버라이딩가능할까? 아래는 테스트할 때 사용할 기본 틀 from airflow..

Airflow 2022.05.09 0

Kubernetes) Forbidden User 보는 방법_role,sa

Forbidden 에러, clusterrole과 serviceaccount로 해결 clusterrole과 serviceaccount 확인하기 spark 테스트하는 도중 권한 관련 로그를 접했어요 #kubernetes.client.rest.ApiException: (403) #Reason: Forbidden #HTTP response headers: HTTPHeaderDict({'Cache-Control': 'no-cache, private', 'Content-Type': 'application/json', 'X-Content-Type-Options': 'nosniff', 'Date': 'Fri, 19 Nov 2021 06:50:38 GMT', 'Content-Length': '417'}) #HTTP re..

K8S 2021.11.23 0

최신글

more

AI-Vision) 데이터 엔지니어 AI 도전기 (1)_Semantic Segmentation #Unet #Instance와 차이

처음 Vision Model을 공부하다가, Yolo를 보면서 쉬워 보여 무시했는데Unet을 하면서 당황했던 경험을 정리했습니다 ( 이 글은 모델의 원리보다는 사용에 초점을 맞춥니다. ) .예상 독자는 아래와 같습니다.YOLO 말고 다른 Vision Model을 쓰시려는 분Semantic Segmentation을 처음 시작하는 분Unet을 처음부터 떠먹여 줄 글을 찾는 분.목차는 아래와 같습니다Semantic이란 무엇인가요? (Instance와 비교)데이터셋 구조는 어떻게 되나요? (Original & mask)Prediction은 어떻게 나오나요? (Binary vs Multi-class).제 목표는 아래와 같습니다.이 글을 끝까지 읽으면, 아래 그림이 무엇을 뜻하는..

Vision 2024.04.14 1

데이터 잡부의 MLOps도전기 (3) - 모델 배포를 위해 FaaS를 세팅해보자 #Nuclio

Model의 동적 배포를 위해서, FaaS를 도입한 이야기를 적어봤습니다. 글의 구조는 아래와 같습니다.Nuclio가 무엇인가요?왜 굳이 Nuclio인가요?CVAT과 어떻게 연동을 하나요?. 글의 타깃 독자는 아래와 같습니다.Nuclio(FaaS)에 대해 궁금하신 분Vision ML 인퍼런싱을 고려하는 분CVAT을 사용하시는 분 지난 포스팅에서는 아래 2가지를 적었고Vision MLOps 프로젝트 투입: https://mightytedkim.tistory.com/205라벨링 툴로 CVAT을 선택한 이유: https://mightytedkim.tistory.com/206이번에는 `동적 모델링`을 위해 ‘FaaS’인 ‘Nuclio’를 도입한 내용을 적었어요. 1. Nuclio가 뭐에요?nuclio는 FaaS..

MLOps 2024.03.31 1

스타트업에서 POC를 위해 논문 참고하는 법_AR Glass,원격협업

회사에서 최근 원격 협업 시스템 POC를 진행하고 있어요 Hololens2, Quest3, TCL 등의 AR glass를 이용해서, 원격으로 협업할 수 있는 샘플 프로젝트를 만들어야해요. 너무 막막한 상황 속에서... 구글링하다가 도움을 받은 논문을 정리해보려고 해요. 인천대학교에서 작성한 것으로, 건설 현장에서의 원격 협업 시스템 개발에 대해 이야기를 해요. 먼저 GPT가 요약한 내용을 보고, 제가 인사이트를 얻은 부분에 대해서 정리하려고 합니다. # 논문 요약 (GPT) 이 연구는 혼합 현실(Mixed Reality, MR)을 기반으로 한 건설 현장 관리를 위한 원격 협업 시스템 개발에 관한 것입니다. 건축 정보 모델링(BIM)의 데이터 호환성을 활용하고, MR 기술을 통해 실세계 객체 위에 3D 가..

기타 2024.03.17 1

k8s) cka 자격증 후기_칠지말지 고민될 때 보면 좋을 내용

업무에 쿠버네티스를 많이 사용하고 있는데, 알고 있는 것을 점검하고자 자격증을 공부했어요 인강은 작년에 Udemy를 들엇지만, 1년짜리 유효기간이 시험이라 끝까지 미루다가 얼마전에 시험을 쳤어요 ㅎ 예상 독자는 다음과 같습니다. CKA 시험을 치려고 고민하시는 분 읽고 얻으실 수 있는건 아래와 같아요 시험을 쳐야할지 말아야지 결정에 필요한 정보 1. 쿠버네티스 자격증이란? Linux foundation에서 제공하는 여러 자격들 중 하나에요 CKAD, CKA, CKS 등이 있어요 2. 공부 전 알아야하는 내용 시험을 치는 이유 ( 지식 습득 > 취업 스펙 ) 많은 사람들이 UDEMY에서 인강 듣고, 그냥 치면 딸 수 있는 시험이라고 해요. 그래서 쉬워 보이는데 생각보다 준비기간이 오래 걸립니다. 쿠버네티..

K8S 2024.02.04 1

데이터 잡부의 MLOps도전기 (2) - 라벨링 툴로 CVAT을 선택한 이유 #VISION

라벨링 툴로 왜 CVAT을 선택했는지 정리했습니다 :) 글의 구조는 아래와 같습니다.CVAT이 뭐에요?선택한 이유는 뭐에요?아쉬운 점은 뭐에요?. 글의 타깃 독자는 아래와 같습니다.Labeling 툴 도입을 고민하시는 분CVAT을 사용하시는 분CVAT 도입을 고민하시는 분. 지난 포스팅에서는 Vision MLOps 프로젝트에 투입된 배경에 대해서 정리했어요 https://mightytedkim.tistory.com/205 데이터 잡부의 도전기 #Vision#CVAT#Nuclio23년 하반기는 힘들었지만 재미있었어요. 새로운 분야를 접했거든요 '데이터 잡부'의 도전에 대해 정리하려 합니다 :) 글의 구조는 아래와 같습니다. 원래 하던 업무 (pipeline) 제안받은 업무 (MLops)mightytedki..

MLOps 2024.01.21 0