인코딩 정리(원핫인코딩/레이블인코딩)
※ 본내용은 퇴근후딴짓 강의를 참고하였습니다 인코딩 정리전에는 타겟을 미리 pop으로 빼줌 개인적인 의견원핫 인코딩: 카테고리 10개 미만레이블 인코딩: 카테고리 10개 이상 1. train과 test 데이터에서 범주형 컬럼의 카테고리가 같을 때- 원핫 or 레이블 둘 다 상관없음 import pandas as pdtrain = pd.DataFrame({ '과일': ['사과', '배', '포도'], '색상': ['빨강', '노랑', '보라'], '가격': [5000, 7000, 10000], 'target': ['a', 'a', 'b']})test = pd.DataFrame({ '과일': ['사과', '배', '포도'], '색상': ['빨강', '노랑', '보라'], ..
2024. 6. 18.