'데이터 엔지니어'로 성장하기

정리하는 걸 좋아하고, 남이 읽으면 더 좋아함

Data/Spark

Spark) Thrift serverHive-Metastore OOM 해결_메모리 추가할당

MightyTedKim 2022. 1. 10. 09:16
728x90
반응형

갑자기 월요일 아침에 확인해보니 airflow job들이 일부 죽어잇음, 일단 request/limit 수정함

상황

- 왜그런가하고 봣는데, Thrift Server 사용하는 job들만 죽음

- 에러 로그는

 err_msg = java.sql.SQLException: Error running query: org.apache.thrift.transport.TTransportException
- hive meta store Pod를 보니까 pool, OOM
 Exception in thread "pool-7-thread-921" java.lang.OutOfMemoryError: GC overhead limit exceeded

문제

hivemetastore 메모리 부족


해결

metastore.yaml을 수정함, 메모리를 늘려줌, 아래 메모리는 예시
resources:
          requests:
            memory: "20G" #"2G"
            cpu: 2
        imagePullPolicy: Always
확인
- pod 상태
NAME                                         DESIRED   CURRENT   READY   AGE
replicaset.apps/metastore-84549b479          1         1         1       18m --> 수정: memory 20G
replicaset.apps/metastore-b84879c9c          0         0         0       37d  --> 기존: memory 2G

 

- airflow job 정상 작동 확인

 

+ 2022-03-25

오늘 또 동일한 문제가 발생했다.

메모리 request를 늘리고, limits도 설정해줬다.

전에 해결된것은 pod 재기동해서 그렇지

설정값을 수정했기 때문은 아닌 것으로 보임

 

또 내려가는지 확인 후 다시 돌아올 예정

728x90
반응형