빅데이터분석기사 제2유형 : 회귀문제 예제1
에어비엔비 가격?평가: R-Squared, MAE, MSE, RMSE, RMSLE, MAPEtarget : price(가격)csv파일 생성 : 수험번호.csv (예시 아래 참조)id,price34323697,23829927138,183120362,234 데이터 불러오기와 EDA import pandas as pdtrain = pd.read_csv("train.csv")test = pd.read_csv("test.csv")print(train.shape, test.shape)train.head(3)train.isnull().sum()test.isnull().sum()#분류는 value_counts()를 쓰지만 회귀는 의미가 없음(데이터가 다 달라서)#일반적으로는 그래프 모델을 보지만, 빅분귀에서는 사용이..
2024. 6. 7.
빅데이터분석기사 제2유형 : 분류문제 예제1
신용카드서비스를 떠나는 고객을 찾아라나이, 급여, 결혼 상태, 신용 카드 한도, 신용 카드 카테고리 등의 컬럼이 있음평가: ROC-AUC, 정확도(Accuracy), F1, 정밀도(Precision), 재현율(Recall)을 구하시오target : Attrition_Flag (1:이탈, 0:유지)csv파일 생성 : 수험번호.csv (예시 아래 참조)CLIENTNUM,Attrition_Flag 788544108,0.633 719356008,0.123 712142733,0.355 데이터불러오기 import pandas as pdtrain = pd.read_csv('train.csv')test= pd.read_csv('test.csv')train.head(5)#데이터의 크기를 확인했더니, train에는 타겟값..
2024. 6. 7.
빅데이터분석기사 제2유형 : ⑥ 평가지표
이진분류 평가지표# 머신러닝 예시 코드import pandas as pdfrom sklearn.ensemble import RandomForestClassifier# traintrain = pd.DataFrame({ 'f1': [2, 3, 5, 7, 11, 13, 17, 19, 23, 29], 'f2': [30, 28, 26, 24, 22, 20, 18, 16, 14, 12], 'target': ['A', 'A', 'A', 'B', 'B', 'A', 'A', 'A', 'A', 'B']})# testtest = pd.DataFrame({ 'f1': [7, 9, 15], 'f2': [23, 18, 26]})# target 데이터 분리target = train.pop('target'..
2024. 6. 6.