일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 입문나이프
- k8sgpt
- 티스토리챌린지
- 쿠버네티스보안
- 오블완
- 피카푸클램핑도봉산
- kubernetes-ai
- 글램핑
- 파드
- kubernetes
- api-key
- karpor
- IT
- mac터널링
- 피카푸캠핑도봉산
- 쿠버네티스
- 입문용칼
- kub-ai
- 쿠버네티스기초
- AI
- 캠핑
- virt-manager
- 피카푸글램핑
- k8s
- 도봉산글램핑
- KVM
- kube-ai
- POD
- macos 터널링
- GPU
- Today
- Total
목록GPU (3)
마구잡

Kubernetes와 Nvidia GPU Component의 상관관계IT 업계 더 나아가 전반적인 모든 기업들이 AI로 뜨거운 지금, 당연하게도 kubernetes또한 GPU 자원 사용을 지원하고 kube-flow, air-flow, Ollama등 많은 오픈소스들을 사용 할 수 있게 되었다. 이 중 시장을 독점하고 있는 Nvidia의 GPU 자원을 사용하기 위한 Component들이 어느 순서로 어떤 동작을 어떻게 진행하는지 간한하게 알아본다. ( 공식 사이트에서 발췌한 내용을 기반으로 작성하였으나, 명확하지 않은 부분은 경험을 토대로 작성하였습니다. 이는 명확한 정보가 아닐 수 있음을 알려드립니다. )공식 사이트( 광고 클릭은 큰 힘이 됩니다! ) Architecture Overview — NVIDIA..
개요 Openstack으로 생성한 쿠버네티스 클러스터에 GPU를 사용하고싶어졌다. 그리하여 하나의 인스턴스에 PCI Passtrough통한 GPU 할당을 해보자. GPU 장치의 PCI 번호가 정상적으로 출력된다는 전제하에 해당 절차를 진행한다. 방법 root@osp:~# sudo lspci -nn | grep NVIDIA ca:00.0 3D controller [0302]: NVIDIA Corporation GA100 [A100 PCIe 80GB] [10de:20b5] (rev a1) 위 장치 번호 10de:20b5를 기억하자 nova.conf 설정 ( nova.conf의 설정이 각 컴포넌트별로 나눠진경우 filter 설정은 novr-scheduler.conf, PCI 설정은 nova-api.conf에 ..

4줄 요약1. /etc/default/grub 부트로더 수정2. “GRUB_CMDLINE_LINUX_DEFAULT=" 뒤에 "pci=realloc=off"를 아래와 같이 따옴표 안에 추가3. 저장한뒤 "update-grub" 부트로더 업데이트.4. OS 재부팅 진행. dmesg 확인 nvidia-smi 확인 광고 클릭은 큰 힘이 됩니다개요타 부서에서 GPU 드라이버를 설치했는데도 A100 GPU가 제대로 올라오지 않는 문제가 발생하였다.드라이버 또한 nvidia 공식 서폿 페이지에서 받거나 "ubuntu-drivers autoinstall" 명령어를 사용하였지만nvidia-smi 커맨드가 먹통이라고 도움 요청이 들어왔다.( 이미 일처리 끝낸다음 터미널을 닫아 버려서 스크린샷이 없다.. ㅠㅡㅠ) 대충 nv..