[Python] Hugging Face Transformers로 문서 요약하기

728x90

안녕하세요

오늘은 LLM(Large Language Model)을 활용해서 긴 텍스트를 짧게 요약(summarization) 하는 방법을 소개해드리겠습니다.
요즘 AI 모델들은 단순히 텍스트를 생성하는 수준을 넘어, 주어진 문서에서 핵심만 뽑아내는 요약 작업도 잘해내는 편니다.

1. 환경 준비

pip install transformers torch

2. 파이썬 코드 작성

Hugging Face의 pipeline 기능을 이용하면 요약 모델을 아주 쉽게 불러올 수 있습니다.
이번 예제에서는 facebook/bart-large-cnn 모델을 사용했습니다.

# pip install transformers torch

from transformers import pipeline

# 1. Summarization 파이프라인 불러오기
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")

# 2. 긴 문서 준비
text = """
Large Language Models (LLMs) are a type of artificial intelligence trained on massive text datasets. 
They can perform tasks such as answering questions, summarizing information, translating languages, and generating human-like text. 
Although they are powerful, they also have limitations, such as producing incorrect or biased outputs, and requiring large computational resources.
"""

# 3. 요약 실행
summary = summarizer(text, max_length=50, min_length=20, do_sample=False)

# 4. 결과 출력
print("Original text:\n", text)
print("\nSummary:\n", summary[0]['summary_text'])

이렇게 pipeline("summarization")을 활용하면 복잡한 설정 없이도 바로 문서 요약 기능을 사용할 수 있습니다.
실제 서비스에서는 뉴스 기사 요약, 리포트 핵심 추출, 이메일 본문 요약 등에 활용됩니다.

Hugging Face의 다양한 모델을 조합하면 “텍스트 생성 → 요약 → 분류 → 번역” 같은 파이프라인도 만들 수 있으니,하나씩 실험해보시는 걸 추천드립니다

'Python' 카테고리의 다른 글

[Python] EBU R128 기준으로 오디오 라우드니스 정규화하기 (배치 처리) (0)	2025.09.18
[Python] 파이썬으로 AI 감정 분석 해보기 (0)	2025.09.17
[Python] 내장함수 zip 사용법 알아보기 (0)	2025.09.14
[Python] Hugging Face의 transformers 라이브러리를 활용한 감정 분석(Sentiment Analysis) (0)	2025.09.11
[Python] 문서 임베딩으로 간단한 의미 검색기 만들기 (sentence-transformers) (0)	2025.09.10

팀노바 & Stickode 개발자 블로그

[Python] Hugging Face Transformers로 문서 요약하기

'Python' 카테고리의 다른 글

티스토리툴바

[Python] Hugging Face Transformers로 문서 요약하기

'Python' 카테고리의 다른 글

관련글

티스토리툴바