파이썬 스크립트

🐍 Python | Hugging Face 모델, 왜 요약을 못할까? (Base vs. Instruct 모델, 버전 충돌 해결기)

Billcorea 2025. 11. 9. 15:21

🐍 Python | Hugging Face 모델, 왜 요약을 못할까? (Base vs. Instruct 모델, 버전 충돌 해결기)

개요 (Intro)

Hugging Face 모델 로딩 시 마주쳤던 인증 오류(401, 403)를 해결한 후, 새로운 문제에 직면했다. 모델이 요약 지시를 제대로 따르지 않았고, 이를 해결하는 과정에서 예상치 못한 라이브러리 버전 충돌까지 겪었다. 오늘의 일지는 이 두 가지 문제를 해결한 과정을 상세히 기록한다.

📅 날짜: 2025.11.09
🎯 목표: Gemma 모델이 뉴스 기사를 의미 있는 한국어로 요약하도록 만들기
🧰 기술: Python, Hugging Face (transformers, torch, torchvision)

문제 정의 (Problem / Motivation)

인증 문제를 모두 해결하고 `google/gemma-2b` 모델을 성공적으로 로드했지만, 정작 중요한 요약 기능이 제대로 동작하지 않았다. 게다가 문제를 해결하려다 새로운 오류까지 발생했다.

문제 1: 모델이 지시를 따르지 않음

분명 "요약해줘"라고 요청했지만, 모델은 엉뚱한 텍스트를 생성하거나 입력한 프롬프트를 그대로 반복할 뿐, 의미 있는 요약문을 만들어내지 못했다.

문제 2: `torchvision` 버전 충돌 오류

라이브러리 버전 문제 해결을 위해 `pip install --upgrade`를 실행한 후, 이전에는 없던 새로운 오류가 발생했다. 모델 로딩 단계에서 `RuntimeError: operator torchvision::nms does not exist` 라는 메시지와 함께 프로그램이 중단되었다.


ModuleNotFoundError: Could not import module 'GemmaForCausalLM'. Are this object's requirements defined correctly?
... (Caused by)
RuntimeError: operator torchvision::nms does not exist

해결 과정 (How I Solved It)

두 문제는 별개의 원인을 가지고 있었고, 하나씩 해결해 나갔다.

Base 모델 vs. Instruction-Tuned 모델의 차이 이해:
첫 번째 문제의 원인은 모델 선택에 있었다. 내가 사용한 `google/gemma-2b`는 **기반(Base) 모델**로, 다음에 올 단어를 예측할 뿐 지시를 따르도록 훈련되지 않았다. "요약"과 같은 특정 작업을 수행하려면, 지시를 따르도록 미세조정(Fine-tuning)된 **Instruction-Tuned 모델 (`google/gemma-2b-it`)**을 사용해야 했다.
```
# 수정 전
# model_name = "google/gemma-2b"

# 수정 후: Instruction-Tuned 모델로 변경
model_name = "google/gemma-2b-it"
            
```
또한, 모델이 생성한 전체 텍스트에서 입력 프롬프트를 제외하고 순수 요약 결과만 추출하도록 코드 로직을 개선했다.
라이브러리 버전 충돌 해결:
두 번째 문제의 원인은 `torch`와 `torchvision`의 버전 호환성이 깨졌기 때문이었다. `pip install --upgrade`가 각 라이브러리를 개별적으로 최신화하면서 발생한 문제로 추정된다. 가장 확실한 해결책은 관련 라이브러리를 완전히 삭제하고 재설치하는 것이었다.
```
# 1. 기존 라이브러리 완전 삭제
pip uninstall torch torchvision -y

# 2. 호환되는 버전으로 재설치
pip install torch
pip install torchvision
            
```

결과 (Result)

위의 과정을 통해 모든 문제를 해결하고, 마침내 `gemma-2b-it` 모델이 정상적으로 다운로드되는 것을 확인했다.

✅ `torch`와 `torchvision` 버전 충돌 문제 해결!
✅ Base 모델 대신 Instruction-Tuned 모델(`gemma-2b-it`)을 사용하도록 코드 수정 완료!
⏳ 현재 새로운 `gemma-2b-it` 모델 다운로드 진행 중 (100% 완료되면 요약 기능 정상 동작 기대)

느낀 점 / 회고 (Reflection)

LLM을 사용할 때 **Base 모델**과 **Instruction-Tuned 모델**의 차이를 아는 것이 매우 중요하다는 것을 깨달았다. 특정 작업을 시키려면 반드시 `-it`나 `-instruct`가 붙은 모델을 써야 한다.
라이브러리 버전 문제는 언제나 복병이다. `pip install --upgrade`가 만능 해결책이 아니며, 때로는 깨끗하게 삭제 후 재설치하는 것이 더 확실한 방법이다.
오류 로그를 차근차근 읽는 것이 문제 해결의 가장 빠른 길이다. `torchvision::nms`라는 키워드를 통해 `torch`와 `torchvision`의 관계를 의심해 볼 수 있었다.

참고자료 (References)

저작자표시 (새창열림)

'파이썬 스크립트' 카테고리의 다른 글

티스토리 글을 네이버 블로그로 이전하기 (Playwright + Python 자동화 회고) (0)	2026.02.09
- 🐍 Python \| CamelCase를 snake_case로 변환하고 SQLite에서 단일 row 조회하기 --- (0)	2025.11.07
🐍 Python \| Raspberry Pi에서 오픈소스 LLM으로 뉴스 요약기 만들기 --- (1)	2025.11.05
🐍 Python \| 문자열 처리와 xlwings로 엑셀 데이터 다루기 --- (0)	2025.11.01
오늘의 개발일지: 웹 스크래핑 삽질에서 모듈화까지(ft Python) (1)	2025.10.28

현재글🐍 Python | Hugging Face 모델, 왜 요약을 못할까? (Base vs. Instruct 모델, 버전 충돌 해결기)

👉android app's 개발 및 유지보수 지원 (kotlin, jetpack compose 기반) 👉보유기술 : android, java, kotlin, jetpack compose, sqlite, room, firebase, retrofit, ktor 👉잊어버릴 것 같은 이야기 정리 하기, 사는 이야기 정리 하기 👉 2020.12.13 블로그 시작

앱설명서, Jetpack, compose, billcorea, Retrofit, Python, 앱개발, ChatGPT, AI, 내돈내산, Android, 글쓰기, 챗봇, 자동글쓰기, 개발일기, Kotlin, JetpackCompose, 안드로이드, 앱만들기, 파이썬,

Today :
Yesterday :

생각저장소 (배움의길에서 만나는 이야기)