Job은 지정된 GPU 또는 CPU 리소스에서 명령어를 실행하고 완료되면 자동으로 종료돼요. Workspace와 달리 비대화형(non-interactive)이라, 파인튜닝 스크립트나 평가 파이프라인을 제출해 두면 알아서 끝까지 돌아가요. 배치 잡은 이런 작업에 적합해요:Documentation Index
Fetch the complete documentation index at: https://docs.cloud.vessl.ai/llms.txt
Use this file to discover all available pages before exploring further.
- 모델 학습과 파인튜닝
- 배치 추론과 평가
- 데이터 전처리 파이프라인
- 하이퍼파라미터 스윕(hyperparameter sweep): 여러 Job을 동시에 실행

Job vs Workspace
| Job | Workspace | |
|---|---|---|
| 상호작용 | 비대화형(명령어 실행) | 대화형(SSH, JupyterLab) |
| 생명주기 | 시작 → 실행 → 자동 완료 | 일시정지 또는 종료할 때까지 실행 유지 |
| 과금 | 실행 중에만 | 실행 중에는 GPU와 스토리지, 일시정지 중에는 스토리지만 |
| 적합한 용도 | 학습, 배치 처리, 스윕 | 개발, 디버깅, 탐색 |
Job 상태
| 상태 | 의미 |
|---|---|
scheduling | 리소스가 확보될 때까지 대기하는 상태예요. Waiting for GPU capacity처럼 대기열에 들어간 이유가 함께 표시돼요. |
running | 명령어가 할당된 리소스에서 실제로 실행되고 있어요. |
succeeded | 명령어가 성공적으로 끝났어요(exit code 0). 연결된 볼륨에 저장된 결과는 유지돼요. |
failed | 명령어가 0이 아닌 코드로 종료됐거나 컨테이너가 비정상 종료됐어요(예: OOMKilled). 로그를 확인해 원인을 파악하세요. |
terminated | Job이 끝나기 전에 사용자가 직접 취소했어요. |
다음 단계
- Job 목록 조회하기: 배치 잡 둘러보기, 필터링, 검색
- Job 만들기: CLI로 제출
- Job 상세 정보 보기: 명령어, 이미지, 환경 변수, 볼륨, 태그 확인
- 로그 보기: 컨테이너 출력 실시간 스트리밍
- 메트릭 모니터링하기: GPU, VRAM, CPU, 메모리 사용량 추적
- Job 정리하기: 실행 중인 Job 종료와 완료된 Job 안 보이게 하기
- 전체 CLI 레퍼런스:
vesslctl job
