본문 바로가기
테크공부/자연어처리

인공지능의 신뢰성 확보 방안

by es25n.n 2024. 7. 31.

 

 

🫧인공지능 신뢰성 확보 방안

 

 

1. 양질의 데이터 확보

- 데이터 양은 충분한가?

- 적은 데이터 수는 곧바로 분석 결과의 신뢰성 하락으로 연결됨.

  이는 많은 데이터를 통해 충분히 검증한 결과와 그렇지 않은 결과의 차이

- 예외는 있음: 적은 데이터로도 문제 해결을 충분히 해낼 수 있기도 함 (양질의 데이터)

 

 

2. 믿을 수 있는 데이터인가?

- 데이터 수가 뒷받침된다고 해서 모든 데이터를 활용할 수 있는 것은 아님

- 분석 결과를 누구나 인정할 수 있도록 데이터 자체에 대한 신뢰성이 뒷받침되어야 함

 

🙄 데이터 신뢰성이란?

: 데이터가 얼마나 편향되지 않고, 실제 정보를 똑바로 담고 있는가

 

 

3. 데이터가 순수한 정형데이터인가?

#데이터 유형 구분

반정형 데이터 : 구조 정보를 포함한 내용을 담고 있어 데이터라고 충분히 분류할 수 있는 데이터

비정형 데이터 : 정의된 구조가 없는 데이터 텍스트, 이미지, 영상, 오디오 등의 데이터

정형 데이터 : 미리 정해 놓은 형식과 구조가 있어 그에 따라 고정된 자리에 저장된 데이터

                        행과 열의 형태로 담겨 엑셀로 저장할 수 있는 데이터 (숫자 형식으로 지정된 데이터)