machine #learning #기계학습 #data #preprocessing #데이터 #전처리1 데이터 전처리 (1) 1. 데이터 전처리 정의(1) 정의데이터의 품질을 올리는 과정 (2) 데이터 전처리 과정데이터 실수화- 컴퓨터가 이해할 수 있는 값으로의 변환불완전한 데이터 제거- NULL, NA, NAN 값의 제거잡음 섞인 데이터 제거- 가격 데이터에 있는 (-) 값 제거- 연령 데이터 중 과도하게 큰 값 제거모순된 데이터 제거- 남성 데이터 중 주민번호가 '2'로 시작하는 경우불균형 데이터 해결- 과소표집(undersampling)- 과대표집(oversampling) 2. 데이터 전처리 기법데이터 실수화 (Data Verctorization)범주형 데이터, 텍스트 자료, 이미지 자료 등을 실수로 구성된 형태로 전환하는 것데이터 정제 (Data Cleaning)없는 데이터는 채우고, 잡음 데이터는 제거하고, 모순 데이.. 2024. 6. 9. 이전 1 다음