🫧인공지능 신뢰성 확보 방안
1. 양질의 데이터 확보
- 데이터 양은 충분한가?
- 적은 데이터 수는 곧바로 분석 결과의 신뢰성 하락으로 연결됨.
이는 많은 데이터를 통해 충분히 검증한 결과와 그렇지 않은 결과의 차이
- 예외는 있음: 적은 데이터로도 문제 해결을 충분히 해낼 수 있기도 함 (양질의 데이터)
2. 믿을 수 있는 데이터인가?
- 데이터 수가 뒷받침된다고 해서 모든 데이터를 활용할 수 있는 것은 아님
- 분석 결과를 누구나 인정할 수 있도록 데이터 자체에 대한 신뢰성이 뒷받침되어야 함
🙄 데이터 신뢰성이란?
: 데이터가 얼마나 편향되지 않고, 실제 정보를 똑바로 담고 있는가
3. 데이터가 순수한 정형데이터인가?
#데이터 유형 구분
• 반정형 데이터 : 구조 정보를 포함한 내용을 담고 있어 데이터라고 충분히 분류할 수 있는 데이터
• 비정형 데이터 : 정의된 구조가 없는 데이터 텍스트, 이미지, 영상, 오디오 등의 데이터
• 정형 데이터 : 미리 정해 놓은 형식과 구조가 있어 그에 따라 고정된 자리에 저장된 데이터
행과 열의 형태로 담겨 엑셀로 저장할 수 있는 데이터 (숫자 형식으로 지정된 데이터)
'테크공부 > 자연어처리' 카테고리의 다른 글
Neuro-Symbolic AI (0) | 2024.07.31 |
---|---|
Prompt Engineering와 Prompt Tuning (1) | 2024.07.31 |
포브스가 선정한 5가지 인공지능 편향 (0) | 2024.07.31 |
규칙 기반 모델과 딥러닝 기반 모델 비교 (0) | 2024.07.31 |
딥러닝 / 인공지능 / 머신러닝 구분하기 (0) | 2024.07.31 |