본문 바로가기
반응형

IT&게임27

[빅분기] 여러가지 에러 케이스 ※ 본내용은 퇴근후딴짓 강의를 참고하였습니다. # 라이브러리 및 데이러 불러오기import pandas as pd# 와인 데이터 로드from sklearn.datasets import load_winewine = load_wine()df = pd.DataFrame(wine.data, columns=wine.feature_names)df['target'] = wine.targetdf.head()https://bit.ly/3H64wpG  에러1. 스케일링# 에러 코드import pandas as pdfrom sklearn.datasets import load_winewine = load_wine()df = pd.DataFrame(wine.data, columns=wine.feature_names)df['ta.. 2024. 6. 18.
빅데이터분석기사 제2유형 : 회귀문제 예제1 에어비엔비 가격?평가: R-Squared, MAE, MSE, RMSE, RMSLE, MAPEtarget : price(가격)csv파일 생성 : 수험번호.csv (예시 아래 참조)id,price34323697,23829927138,183120362,234 데이터 불러오기와 EDA import pandas as pdtrain = pd.read_csv("train.csv")test = pd.read_csv("test.csv")print(train.shape, test.shape)train.head(3)train.isnull().sum()test.isnull().sum()#분류는 value_counts()를 쓰지만 회귀는 의미가 없음(데이터가 다 달라서)#일반적으로는 그래프 모델을 보지만, 빅분귀에서는 사용이.. 2024. 6. 7.
빅데이터분석기사 제2유형 : 분류문제 예제1 신용카드서비스를 떠나는 고객을 찾아라나이, 급여, 결혼 상태, 신용 카드 한도, 신용 카드 카테고리 등의 컬럼이 있음평가: ROC-AUC, 정확도(Accuracy), F1, 정밀도(Precision), 재현율(Recall)을 구하시오target : Attrition_Flag (1:이탈, 0:유지)csv파일 생성 : 수험번호.csv (예시 아래 참조)CLIENTNUM,Attrition_Flag 788544108,0.633 719356008,0.123 712142733,0.355 데이터불러오기 import pandas as pdtrain = pd.read_csv('train.csv')test= pd.read_csv('test.csv')train.head(5)#데이터의 크기를 확인했더니, train에는 타겟값.. 2024. 6. 7.
빅데이터분석기사 제2유형 : ⑥ 평가지표 이진분류 평가지표# 머신러닝 예시 코드import pandas as pdfrom sklearn.ensemble import RandomForestClassifier# traintrain = pd.DataFrame({ 'f1': [2, 3, 5, 7, 11, 13, 17, 19, 23, 29], 'f2': [30, 28, 26, 24, 22, 20, 18, 16, 14, 12], 'target': ['A', 'A', 'A', 'B', 'B', 'A', 'A', 'A', 'A', 'B']})# testtest = pd.DataFrame({ 'f1': [7, 9, 15], 'f2': [23, 18, 26]})# target 데이터 분리target = train.pop('target'.. 2024. 6. 6.
728x90
반응형