본문 바로가기 메뉴 바로가기

4OurFuture 님의 블로그

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

4OurFuture 님의 블로그

검색하기 폼
  • 분류 전체보기 (162)
    • Python (64)
      • Python Library (19)
      • Django Framework (DRF) (19)
    • 재미있는 Project (7)
      • AI 로또번호 예측 (4)
    • GIT (GitHub) (4)
    • Linux (7)
    • AI 도구 활용방법 (7)
    • 자격증 공부 (1)
    • 자료구조 (4)
    • 자연어 처리 (7)
    • 그밖에 아무거나 (3)
    • 머신러닝&딥러닝 (12)
      • 밑바닥부터 시작하는 딥러닝 (1)
    • 퀀트투자 with Python & 인공지능 (7)
    • RAG (10)
    • 투자공부 (13)
      • 종목분석 (2)
  • 방명록

stemming (1)
표제어 추출(Lemmatization)과 어간 추출(Stemming) 비교

자연어 처리(NLP)에서 텍스트 데이터를 효과적으로 다루기 위해서는 전처리 과정이 필수적입니다. 이 과정에서 가장 흔히 사용되는 기법 중 두 가지가 **표제어 추출(Lemmatization)**과 **어간 추출(Stemming)**입니다. 이 글에서는 이 두 기법을 비교하여 그 차이점과 장단점을 살펴보겠습니다.  1. 정의1.1. 표제어 추출 (Lemmatization)표제어 추출은 단어를 그 기본 형태(표제어)로 변환하는 과정입니다. 문맥을 고려하여 단어의 의미를 유지하며, 일반적으로 사전 기반의 접근 방식을 사용합니다. 예를 들어, "running", "ran", "better"는 모두 "run"으로 변환됩니다.1.2. 어간 추출 (Stemming)어간 추출은 단어의 변형을 줄여 기본 형태인 "어간"..

자연어 처리 2024. 10. 2. 13:02
이전 1 다음
이전 다음
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 로또 1164회 당첨
  • 퀀트투자
  • chat gpt 4o 예산
  • 티스토리챌린지
  • chat gpt 가격 예상
  • 오블완
  • 장고 orm sql문 비교
  • 토치비전
  • 주린이탈출
  • chat gpt api 비용 계산
  • 자동매매
  • 클래스형 뷰
  • chat gpt 한국어 가격
  • chat gpt 모델별 예산
  • 1164회 로또
  • chat gpt 모델 api 가격 예측
  • 주식공부
  • 골든크로스
  • Numpy
  • 인공지능 로또 예측
  • 로또 ai
  • chat gpt 모델 별 가격
  • 자동매매로직
  • 재테크
  • 차트분석
  • 1165회 로또
  • Python
  • 케라스
  • 기술적분석
  • 주식투자
more
«   2026/02   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
글 보관함
250x250

Blog is powered by Tistory / Designed by Tistory

티스토리툴바