비속어/부정어 필터 활용 가이드
온라인 커뮤니티 운영, 블로그 댓글 사전 검토, 학교·기업 SNS 콘텐츠 검수, 청소년 보호 등 다양한 상황에서 비속어 자동 필터링이 필요합니다. 본 도구는 한국어 욕설·비속어 100여 종과 그 변형(예: 시발/씨발/ㅅㅂ/씌발), 그리고 차별어·혐오 표현·부정어를 강도별로 분류해 검출합니다.
강도 1(약함)은 일반적으로 인정되는 욕설만 검출하고, 강도 2(중간)는 성별·인종·지역 차별어를 추가로 포함하며, 강도 3(강함)은 부정적 감정 표현(짜증나, 빡친다, 망함 등)까지 포함해 톤 전체를 정화합니다. 치환 방식은 마스킹(원문 길이만큼 *), 순화(맥락에 맞는 다른 표현으로 교체), 완전 제거 중 선택할 수 있습니다.
검출 방식
- 정규식 기반 변형 매칭: 시발/씨발/ㅅㅂ/시1발 등 자모 분리·숫자 치환·중복 자소 모두 검출
- 강도별 사전 분리: 약(욕설) / 중(욕+차별) / 강(욕+차별+부정)
- 맥락 보존: 마스킹 모드는 글자 수를 유지해 가독성 보존
- 대소문자 무관, 띄어쓰기 변형 매칭
자주 묻는 질문 (FAQ)
Q. 모든 욕설을 100% 잡아내나요?
A. 한국어 욕설은 변형이 매우 다양해(자음만 쓰기, 자모 분리, 발음 유사 단어로 교체 등) 100% 검출은 불가능합니다. 본 도구는 가장 빈번한 100여 종 핵심 키워드와 흔한 변형 패턴을 정규식으로 처리하므로, 실무 검수 시에는 사람의 추가 확인을 권장합니다.
Q. 차별어와 부정어의 차이가 뭔가요?
A. 차별어는 특정 집단(성별·인종·지역·장애·연령)을 대상으로 비하·혐오를 표현하는 단어이고, 부정어는 부정적 감정(짜증, 화남, 좌절)을 나타내지만 누군가를 공격하지는 않는 표현입니다. 강도 2는 차별어, 강도 3은 부정어까지 포함합니다.
Q. 순화 표현으로 치환되는 예시는?
A. '짜증나' → '아쉽다', '망함' → '아쉬운 결과', '빡친다' → '속상하다' 등 비슷한 의미의 중립 표현으로 자동 치환됩니다. 욕설 자체는 마스킹 처리되어 ***로 표시됩니다.