> ## Documentation Index
> Fetch the complete documentation index at: https://docs.cloud.vessl.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# 메트릭 모니터링하기

> 배치 잡의 GPU, VRAM, 온도, CPU, 메모리, 네트워크, 스토리지 사용량을 추적해요.

**Metrics** 탭에서는 GPU, VRAM, 온도, CPU, 메모리, 네트워크, 스토리지 시계열 차트를 보여줘서, Job 실행 중이나 종료 후에도 하드웨어가 효율적으로 쓰이고 있는지 확인하고 낭비를 찾아낼 수 있어요.

<div>
  <Frame>
    <img style={{ borderRadius: '0.5rem' }} src="https://mintcdn.com/dora/LUWzC5lx5RwOccfw/images/Job_metrics.png?fit=max&auto=format&n=LUWzC5lx5RwOccfw&q=85&s=8902924d46f291dbc5f455cccb1e688f" alt="GPU, VRAM, 온도, CPU, 메모리, 네트워크, 스토리지 차트가 보이는 Job 메트릭 탭" width="7680" height="8880" data-path="images/Job_metrics.png" />
  </Frame>

  <small>예시: Job 메트릭</small>
</div>

## 차트

Job 메트릭은 Workspace와 동일한 차트 패밀리를 사용해요. 임계값과 축 단위, 해석 방법은 [Workspace 메트릭](/ko/member/workspace/metrics)을 참고해 주세요:

* **GPU 사용률**(0-100%): 컴퓨트 사용량. **30%** 미만이면 리소스가 과다 할당됐을 수 있어요.
* **VRAM 사용량**(GB): 그래픽 메모리 사용량. <strong>95%</strong>를 넘으면 OOM(Out of Memory) 위험이 있어요.
* **온도**(°C): <strong>85°C</strong>를 지속적으로 넘으면 thermal throttling이 발생할 수 있어요.
* **CPU·메모리**: 할당된 CPU 코어와 시스템 RAM 사용량.
* **네트워크 I/O**: 들어오고(Rx) 나가는(Tx) 데이터 전송량.
* **스토리지**: Job에 마운트된 Temporary, Cluster storage, Object storage 사용량.

## 시간 범위

차트 상단의 시간 범위 셀렉터에서 윈도우를 선택할 수 있어요: **1h**(기본), **6h**, **12h**, **1d**, **7d**. 모든 차트가 함께 갱신돼요.

## Idle 감지

GPU 사용률이 일정 시간(1시간 평균) 동안 **30%** 아래이면 [홈 대시보드](/ko/member/dashboard/overview)에서 idle로 표시돼요. 메트릭을 확인한 다음 과금을 멈추기 위해 Job을 종료할지 그대로 둘지 결정할 수 있어요.

## 함께 보기

* [Workspace 메트릭](/ko/member/workspace/metrics): 차트 레퍼런스와 임계값 전체
* [Job 정리하기](/ko/member/job/cleanup): idle Job을 종료해서 과금을 멈춰요.
* [Job 상세 정보 보기](/ko/member/job/details)
