Today's

길을 나서지 않으면 그 길에서 만날 수 있는 사람을 만날 수 없다

그냥글쓰기

OpenAI gpt-oss-20b 실행 가이드 (퍼옴)

Billcorea 2026. 2. 5. 23:02

 

OpenAI gpt-oss-20b 실행 가이드

open ai gpt oss 20b

 

 

OpenAI가 공개한 gpt-oss-20b 모델은 오픈 웨이트 기반으로 강력한 추론과 에이전트형 작업을 지원합니다. 소비자용 하드웨어에서도 실행 가능하며, 다양한 프레임워크에서 활용할 수 있습니다. 아래는 Hugging Face 페이지 내용을 바탕으로 정리한 실행 가이드입니다.

모델 특징

  • Apache 2.0 라이선스 → 자유로운 연구 및 상업적 활용 가능
  • 추론 수준 조정 가능 (Low / Medium / High)
  • 체인 오브 쏘트(Chain-of-thought) 접근 가능 → 디버깅 및 신뢰성 강화
  • 에이전트 기능: 함수 호출, 웹 브라우징, Python 실행, 구조화된 출력
  • MXFP4 양자화 → 16GB 메모리에서도 실행 가능
  • 파인튜닝 지원 → 개인화된 모델 학습 가능

환경 준비

필수 라이브러리 설치:
pip install -U transformers kernels torch

실행 방법

1. Transformers 활용

from transformers import pipeline
import torch

model_id = "openai/gpt-oss-20b"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype="auto",
    device_map="auto",
)

messages = [{"role": "user", "content": "Explain quantum mechanics clearly."}]
outputs = pipe(messages, max_new_tokens=256)
print(outputs[0]["generated_text"][-1])

서버 실행:

transformers serve
transformers chat localhost:8000 --model-name-or-path openai/gpt-oss-20b

2. vLLM 활용

uv pip install --pre vllm==0.10.1+gptoss \
  --extra-index-url https://wheels.vllm.ai/gpt-oss \
  --extra-index-url https://download.pytorch.org/whl/nightly/cu128 \
  --index-strategy unsafe-best-match

vllm serve openai/gpt-oss-20b

3. Ollama 활용 (소비자용 PC)

ollama pull gpt-oss:20b
ollama run gpt-oss:20b

4. LM Studio 활용

lms get openai/gpt-oss-20b

5. Hugging Face CLI 다운로드

huggingface-cli download openai/gpt-oss-20b --include "original/*" --local-dir gpt-oss-20b/
pip install gpt-oss
python -m gpt_oss.chat model/

추론 수준 설정

시스템 프롬프트에 Reasoning: low, Reasoning: medium, Reasoning: high를 지정하여 응답 속도와 깊이를 조정할 수 있습니다.

활용 예시

  • 대화형 챗봇
  • 코드 실행 및 디버깅
  • 웹 브라우징 기반 에이전트
  • 교육 및 연구용 분석 도구

마무리

gpt-oss-20b는 연구자와 개발자에게 강력한 오픈 모델을 제공합니다. 소비자용 하드웨어에서도 실행 가능하므로, 개인 프로젝트부터 상업적 서비스까지 폭넓게 활용할 수 있습니다.

반응형