빅데이터분석기사 필기 썸네일형 리스트형 [빅데이터분석기사 필기 요약] [빅분기 2과목 요약] II. 빅데이터 탐색 - 요약 빅데이터분석기사 필기 2과목] II. 빅데이터 탐색 01. 데이터 전처리 데이터 전처리: 데이터 정제 - 결측값 처리 - 이상값 처리 - 분석 변수 처리 데이터 정제(Cleansing) - 결측값&이상값 처리를 통해 데이터 신뢰도를 높이는 작업 - 오류 데이터값을 정확한 데이터로 수정/삭제하는 과정 - 오류 원인 분석 - 정제 대상 선정 - 정제 방법 결정 데이터 오류 원인: 결측값(Missing Value)/ 노이즈(Noise)/ 이상값(Outlier) 결측값: 누락된 값 노이즈: 잘못 판단된 값 이상값: 범위에서 많이 벗어난 값 필수적인 데이터가 입력되지 않음 (ex) NA, NaN, NULL, inf, 999999 입력되지 않았는데 입력되었다고 판단됨 범위에서 많이 벗어난 아주 작은/큰 값 데이터 .. 더보기 이전 1 다음