🙄자연어처리를 어렵게 하는 언어의 특성 5가지!
#1. 중의성
- 한 단어가 여러 뜻을 가지고 있다. (다의어)
- 같은 표현이라도 맥락에 따라 다른 의미를 지닌다. (Sarcasm)
#2. 변의성
- 지역, 계층, 연령, 성별에 따라 사용하는 언어가 다르다
- 사투리, 존댓말, 10대 신조어
#3. 문화적 차이
- 같은 의미를 지니더라도 다른 표현으로 나타낸다.
- 속담!
#4. 규칙의 예외
- 불규칙 동사, 명사의 복수형의 예외
- 숙어와 일반 동사나 명사의 의미가 일대일 대응이 안될 수도 있음.
#5. 유연성과 확장성
- 단어를 조합하여 만드는 문장의 수나 길이가 무한하다.
- 새로운 단어가 무한히 새롭게 생성된다.
'테크공부 > 자연어처리' 카테고리의 다른 글
딥러닝 / 인공지능 / 머신러닝 구분하기 (0) | 2024.07.31 |
---|---|
마르코프 가정과 N-gram (0) | 2024.07.31 |
모두를 위한 딥러닝 : Recurrent Neural Network (1) | 2024.04.18 |
모두를 위한 딥러닝 : 임베딩의 이해 (0) | 2024.04.17 |
모두를 위한 딥러닝 : 딥러닝을 이용한 자연어처리 (0) | 2024.04.14 |