LLM 파일 형식 변환하기 (Safetensors to GGUF)

AI2025. 4. 28. 08:47

huggingface_cli 또는 vllm 명령으로 다운로드 받은 Safetensors 형식의 LLM을 ollama 에서 사용하기 위해 GGUF 파일 형식으로 변환하는 작업입니다.

여기에서는 Gemma2:9b 모델을 예로 들었습니다.

1. HuggingFace LLM 다운로드

huggingface_hub 패키지를 설치하고 LLM 다운로드를 위한 파이썬 스크립트를 작성합니다.

(myenv) root@sysdocu:~# pip install huggingface_hub

(myenv) root@sysdocu:~# vi download.py

from huggingface_hub import snapshot_download

model_id= "unsloth/gemma-2-9b-it"

snapshot_download(repo_id=model_id, local_dir="downllm", local_dir_use_symlinks=False, revision="main")

작성한 파이썬 코드를 실행하여 LLM을 다운로드 합니다.

(myenv) root@sysdocu:~# python download.py

2. GGUF 형식 모델 생성

모델을 Safetensors 형식에서 GGUF 형식으로 변환하기 위한 환경을 구성합니다.

(myenv) root@sysdocu:~# git clone https://github.com/ggerganov/llama.cpp.git

(myenv) root@sysdocu:~# pip install -r llama.cpp/requirements.txt

(myenv) root@sysdocu:~# python llama.cpp/convert_hf_to_gguf.py downllm/ --outfile gemma2-9b.gguf

3. Ollama 모델 추가

Modelfile에 GGUL 모델을 지정하고 ollama 명령으로 모델을 생성합니다.

(myenv) root@sysdocu:~# echo "from ./gemma2-9b.gguf" > Modelfile

(myenv) root@sysdocu:~# ollama create gemma2:9b -f Modelfile

(myenv) root@sysdocu:~# ollama list

NAME ID SIZE MODIFIED
gemma2:9b2 26e0cfb6b65 18 GB 2 seconds ago

생성된 모델이 잘 실행됩니다.

(myenv) root@sysdocu:~# ollama run gemma2:9b "hello?"

Hello! 👋 How can I help you today? 😊

저작자표시 (새창열림)

'AI' 카테고리의 다른 글

NGC(NVIDIA GPU Cloud)에서 Ollama 설치 및 모델 구동하기 (0)	2025.08.13
AMD GPU 리소스 모니터링 (amdgpu_top) 설치하기 (0)	2025.04.29
Ubuntu 24.04 에서 BitNet 1-bit LLM 설치 및 사용하기 (0)	2025.04.23
Intel Xeon 4510 x 2 CPU + DDR5 1TB + RTX4090 (or RTX5080) 장비에서 Ktransformers + Deepseek-R1:671B 설치하기 (0)	2025.04.17
Ubuntu 24.04 에서 그래픽카드 (GPU) 선택적 비활성화 하기 (0)	2025.04.14

블로그 소개

공지사항

최근 등록 현황

달력

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

태그 구름

LLM 파일 형식 변환하기 (Safetensors to GGUF)

'AI' 카테고리의 다른 글

최근 글

최근 월별 글

최근 댓글

최근 글

최근 월별 글

최근 댓글

최근 글

최근 월별 글

최근 댓글

지난달

2025.12

다음달

티스토리툴바