비율 지정 글 요약 가이드
TextRank는 Google의 PageRank를 자연어 처리에 적용한 알고리즘으로, 각 문장 간 유사도를 계산해 가장 중요한 문장을 선별합니다.
알고리즘 동작 원리
- 문장 단위로 본문 분할
- 각 문장의 토큰(단어) 추출 (불용어 제거)
- 문장 간 코사인 유사도 그래프 구축
- PageRank 반복 계산 (30회)
- 점수 상위 X% 문장을 원래 순서대로 출력
활용 팁
- 10~20%: 한 문단 핵심만 추출
- 30%: 보고서·이메일 요약
- 50%: 책 한 챕터 요약
- 최소 6문장 이상일 때 권장
자주 묻는 질문 (FAQ)
Q. 외국어 텍스트도 요약 가능한가요?
A. 단어 분리만 잘 되면 가능합니다. 한국어·영어가 가장 안정적입니다.
Q. 너무 짧은 글도 처리되나요?
A. 3문장 이하는 요약 효과가 미미합니다.
Q. 데이터가 서버로 전송되나요?
A. 모든 처리는 브라우저에서만 일어나며 외부 전송이 없습니다.