한국어 텍스트 자동 분류·태깅 가이드
본 도구는 한국어 본문을 분석해 20개 카테고리 중 어디에 속하는지 점수화하고, 빈도 기반(TF) 키워드 추출과 카테고리 가중치 결합으로 해시태그·SEO 키워드를 제안합니다. 블로그 SEO, 뉴스 자동 태깅, 콘텐츠 라이브러리 구축에 활용할 수 있습니다.
20개 카테고리
IT·테크 / 금융·재테크 / 여행·관광 / 요리·맛집 / 건강·의료 / 운동·피트니스 / 뷰티·패션 / 부동산 / 자동차 / 육아·교육 / 반려동물 / 문화·예술 / 영화·드라마 / 게임·e스포츠 / 정치·시사 / 경제·산업 / 스포츠 / 환경·과학 / 자기계발 / 일상·라이프스타일
처리 단계
- 1단계 전처리: 특수문자 제거, 한글·영문·숫자 토큰 추출, 한국어 불용어(stopwords) 80여 개 제거
- 2단계 TF 분석: 2~6글자 명사형 토큰의 빈도 집계
- 3단계 카테고리 분류: 각 카테고리별 사전(50~80 키워드)과 본문 토큰 교집합 점수
- 4단계 정렬: 상위 3개 카테고리 + 해시태그 10개 + SEO 키워드 5개 + 메타 디스크립션 생성
자주 묻는 질문 (FAQ)
Q. 너무 짧은 글도 분류되나요?
A. 100자 미만에서는 정확도가 낮습니다. 안정적인 분류를 위해 본문 200자 이상을 권장합니다.
Q. 영어 글도 분류 가능한가요?
A. 본 도구는 한국어 사전 기반이므로 한국어 비율 70% 이상일 때 가장 정확합니다. 영어 키워드는 부가적으로 추출됩니다.
Q. 생성된 해시태그를 인스타그램에 그대로 써도 되나요?
A. 본문 내용과 일치하면 그대로 사용 가능합니다. 단, 인스타는 30개 이하 권장이며, 본 도구가 제시한 10개에 본인 브랜드 태그 5~10개를 추가하시면 자연스럽습니다.