Summary#
Ollama를 Docker로 띄울 때 NVIDIA GPU passthrough가 빠지면 조용히 CPU 추론으로 떨어지며 지연이 10배 이상 뛴다. 원인은 compose에 deploy.resources.reservations.devices가 없거나 nvidia-container-toolkit 미설치인 경우가 많다. 검증은 ollama ps의 size 대비 VRAM 점유 또는 nvidia-smi 활용도로 한다.
Key Points#
- 증상: gemma·llama 같은 모델이 RTX 3060급에서도 초당 수 토큰으로 떨어지고,
nvidia-smi에 Ollama 프로세스가 안 잡힘 - Docker compose: 반드시
deploy.resources.reservations.devices에capabilities: [gpu]또는 runtime=nvidia 설정 - Host 준비:
nvidia-container-toolkit설치 +systemctl restart docker. 설치 없이는 compose 설정이 무의미 - 검증 루틴: (1)
docker exec <ollama> nvidia-smi로 컨테이너 안에서 GPU 보이는지 (2) 모델 로드 후ollama ps의PROCESSOR필드 확인 (3) inference 중nvidia-smi의 사용률 - VRAM 공존: RTX 3060 12GB에서 Ollama와 ComfyUI/TTS를 같이 쓰려면 모델 swap 전략 필요 — 동시에 로드하면 OOM
Reuse#
homelab 또는 워크스테이션에서 Ollama를 돌리는 모든 경우에 체크해야 할 최소 계약. 실험 결과 속도가 비정상적으로 느리면 코드 버그가 아니라 이 passthrough 누락을 먼저 의심한다.
Sagwan Revalidation 2026-04-18T20:39:40Z#
- verdict:
ok - note: Docker GPU passthrough 핵심 절차(nvidia-container-toolkit, deploy.resources.reservations.devices, 검증 루틴)는 2026년 현재도 유효하며 내용 상 오류나 모순 없음.
Sagwan Revalidation 2026-04-19T20:43:49Z#
- verdict:
ok - note: nvidia-container-toolkit + deploy.resources.reservations.devices 절차는 2026년 현재도 표준이며, 내용·검증 루틴 모두 유효함.
Sagwan Revalidation 2026-04-20T21:04:14Z#
- verdict:
ok - note: LLM unavailable: [CLI 오류 1] SessionEnd hook [node "/home/insu/.pixel-agents/hooks/claude-hook.js"] failed: node:internal/modules/cjs/load
Sagwan Revalidation 2026-04-21T21:33:37Z#
- verdict:
ok - note: LLM unavailable: [CLI 오류 1] SessionEnd hook [node "/home/insu/.pixel-agents/hooks/claude-hook.js"] failed: node:internal/modules/cjs/load
Sagwan Revalidation 2026-04-22T21:58:34Z#
- verdict:
ok - note: LLM unavailable: [CLI 오류 1] SessionEnd hook [node "/home/insu/.pixel-agents/hooks/claude-hook.js"] failed: node:internal/modules/cjs/load
Sagwan Revalidation 2026-04-23T22:06:41Z#
- verdict:
ok - note: nvidia-container-toolkit + deploy.resources.reservations.devices 절차는 2026년 현재 표준이며, 검증 루틴·VRAM 공존 주의사항 모두 유효함.
Sagwan Revalidation 2026-04-24T22:25:03Z#
- verdict:
ok - note: nvidia-container-toolkit + deploy.resources.reservations.devices 절차는 2026년 현재도 표준이며 내용·검증 루틴 모두 유효함.
Sagwan Revalidation 2026-04-25T22:27:38Z#
- verdict:
ok - note: nvidia-container-toolkit + compose GPU 설정 절차는 2026년 현재도 표준이며, 내용·검증 루틴에 오류나 모순 없음.
Sagwan Revalidation 2026-04-26T22:52:08Z#
- verdict:
ok - note: nvidia-container-toolkit + compose GPU 설정 절차는 2026년 현재도 표준이며, 검증 루틴·증상 기술 모두 유효하다.
Sagwan Revalidation 2026-04-27T22:55:19Z#
- verdict:
ok - note: LLM unavailable: [CLI 오류 1] SessionEnd hook [node "/home/insu/.pixel-agents/hooks/claude-hook.js"] failed: node:internal/modules/cjs/load
Sagwan Revalidation 2026-04-28T23:25:58Z#
- verdict:
ok - note: nvidia-container-toolkit + deploy.resources.reservations.devices 절차는 2026년 현재도 표준이며 내용·검증 루틴 모두 유효함.
Sagwan Revalidation 2026-04-30T07:38:24Z#
- verdict:
refresh - note: 핵심은 유효하지만
nvidia-ctk설정과 Composegpus구문 보강이 필요하다.
Sagwan Revalidation 2026-05-01T08:09:14Z#
- verdict:
ok - note: 공식 문서상 toolkit·GPU 예약·
ollama ps검증 루틴이 아직 유효함
Sagwan Revalidation 2026-05-02T08:29:14Z#
- verdict:
refresh - note: 핵심은 유효하지만 compose의 runtime=nvidia 권장은 최신 표준이 아니다.
Sagwan Revalidation 2026-05-03T08:50:34Z#
- verdict:
refresh - note: Ollama 공식 문서는
nvidia-ctk runtime configure까지 요구해 보강 필요
Sagwan Revalidation 2026-05-04T09:24:40Z#
- verdict:
ok - note: NVIDIA Docker GPU passthrough 절차와 검증 루틴은 여전히 유효함
Sagwan Revalidation 2026-05-05T11:12:16Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함
Sagwan Revalidation 2026-05-06T11:22:11Z#
- verdict:
ok - note: NVIDIA Toolkit·Compose GPU 예약·ollama ps 검증 루틴은 여전히 유효함
Related#
- Sleeping Robots Reference Capsule
Sagwan Revalidation 2026-05-07T11:44:26Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·Ollama 검증 절차 모두 현재도 유효함
Sagwan Revalidation 2026-05-08T11:58:23Z#
- verdict:
ok - note: NVIDIA Toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함
Sagwan Revalidation 2026-05-09T12:04:53Z#
- verdict:
ok - note: NVIDIA Docker GPU passthrough와 Ollama 검증 루틴은 여전히 유효함
Sagwan Revalidation 2026-05-10T12:10:43Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·검증 루틴 모두 현행 practice와 부합함
Sagwan Revalidation 2026-05-11T12:35:00Z#
- verdict:
ok - note: NVIDIA Toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함
Sagwan Revalidation 2026-05-12T12:49:16Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·ollama ps 검증 절차 모두 최신 관행과 부합.
Sagwan Revalidation 2026-05-13T13:04:41Z#
- verdict:
ok - note: NVIDIA Docker passthrough 절차와 Ollama GPU 검증 루틴은 여전히 유효함
Sagwan Revalidation 2026-05-14T13:38:00Z#
- verdict:
ok - note: Docker GPU passthrough와 Ollama 검증 절차는 여전히 유효함.
Sagwan Revalidation 2026-05-15T14:09:00Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함
Sagwan Revalidation 2026-05-16T14:33:38Z#
- verdict:
ok - note: NVIDIA Toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함.
Sagwan Revalidation 2026-05-17T15:02:17Z#
- verdict:
ok - note: NVIDIA Docker GPU passthrough 절차와 검증 루틴은 여전히 유효함
Sagwan Revalidation 2026-05-18T15:25:08Z#
- verdict:
ok - note: GPU passthrough 절차와 검증 루틴은 현재도 유효하며 수정 필요 없음.
Sagwan Revalidation 2026-05-19T15:52:02Z#
- verdict:
ok - note: NVIDIA Toolkit·Compose GPU 예약·검증 루틴 모두 현재 practice와 부합함
Sagwan Revalidation 2026-05-20T16:19:57Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함
Sagwan Revalidation 2026-05-21T16:50:18Z#
- verdict:
ok - note: NVIDIA toolkit·compose GPU 예약·ollama ps 검증 루틴 모두 여전히 유효함
Sagwan Revalidation 2026-05-22T16:51:16Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·검증 루틴 모두 여전히 유효함.
Sagwan Revalidation 2026-05-23T17:41:55Z#
- verdict:
ok - note: NVIDIA Toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함
Sagwan Revalidation 2026-05-24T18:00:03Z#
- verdict:
ok - note: NVIDIA Docker GPU passthrough와 Ollama 검증 루틴은 여전히 유효함.
Sagwan Revalidation 2026-05-25T19:08:36Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함.
Sagwan Revalidation 2026-05-26T19:10:29Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·nvidia-smi/ollama ps 검증 모두 현재도 유효.
Sagwan Revalidation 2026-05-27T19:38:24Z#
- verdict:
ok - note: NVIDIA Docker passthrough와 Ollama GPU 검증 루틴은 여전히 유효함
Sagwan Revalidation 2026-05-28T20:50:22Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·검증 루틴 모두 현재도 유효함
Sagwan Revalidation 2026-05-29T20:50:35Z#
- verdict:
ok - note: NVIDIA Docker passthrough와 Ollama GPU 검증 절차 모두 현재도 유효함.
Sagwan Revalidation 2026-05-30T21:35:41Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·ollama ps 검증 루틴 모두 현행 유효.
Sagwan Revalidation 2026-06-01T02:58:53Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·Ollama 검증 루틴 모두 여전히 유효함
Sagwan Revalidation 2026-06-02T03:35:41Z#
- verdict:
ok - note: GPU passthrough 절차와 검증 루틴은 현재 Docker/Ollama practice와 부합함
Sagwan Revalidation 2026-06-03T04:15:14Z#
- verdict:
ok - note: NVIDIA toolkit·Compose GPU 예약·ollama ps 검증 루틴 모두 여전히 유효함
Sagwan Revalidation 2026-06-04T04:51:49Z#
- verdict:
ok - note: Docker/NVIDIA passthrough와 Ollama 검증 절차는 현재도 유효함
Sagwan Revalidation 2026-06-05T05:18:01Z#
- verdict:
ok - note: Docker GPU passthrough 절차와 Ollama 검증 루틴은 여전히 유효함.