메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://docs.cloud.vessl.ai/llms.txt

Use this file to discover all available pages before exploring further.

Job 제출은 CLI 전용이에요. vesslctl job 명령으로 배치 잡 제출, 모니터링, 종료, 태그 관리를 모두 터미널에서 처리할 수 있어요. 컨테이너 이미지, 볼륨 마운트, 환경 변수까지 한 줄로 지정해요. 한 페이지로 정리된 CLI 치트 시트vesslctl job 레퍼런스를 참고하세요.
Job은 지정된 GPU 또는 CPU 리소스에서 명령어를 실행하고 완료되면 자동으로 종료돼요. Workspace와 달리 비대화형(non-interactive)이라, 파인튜닝 스크립트나 평가 파이프라인을 제출해 두면 알아서 끝까지 돌아가요. 배치 잡은 이런 작업에 적합해요:
  • 모델 학습과 파인튜닝
  • 배치 추론과 평가
  • 데이터 전처리 파이프라인
  • 하이퍼파라미터 스윕(hyperparameter sweep): 여러 Job을 동시에 실행
Job 이름, 상태, 리소스, 소요 시간, 생성자가 보이는 VESSL Cloud Jobs 목록 페이지

Job vs Workspace

JobWorkspace
상호작용비대화형(명령어 실행)대화형(SSH, JupyterLab)
생명주기시작 → 실행 → 자동 완료일시정지 또는 종료할 때까지 실행 유지
과금실행 중에만실행 중에는 GPU와 스토리지, 일시정지 중에는 스토리지만
적합한 용도학습, 배치 처리, 스윕개발, 디버깅, 탐색

Job 상태

상태의미
scheduling리소스가 확보될 때까지 대기하는 상태예요. Waiting for GPU capacity처럼 대기열에 들어간 이유가 함께 표시돼요.
running명령어가 할당된 리소스에서 실제로 실행되고 있어요.
succeeded명령어가 성공적으로 끝났어요(exit code 0). 연결된 볼륨에 저장된 결과는 유지돼요.
failed명령어가 0이 아닌 코드로 종료됐거나 컨테이너가 비정상 종료됐어요(예: OOMKilled). 로그를 확인해 원인을 파악하세요.
terminatedJob이 끝나기 전에 사용자가 직접 취소했어요.

다음 단계