반응형 IT&게임/빅데이터분석기사(빅분기)20 빅데이터 분석기사 - 1유형 예제문제 학습하기(결측치) 문제1f1컬럼의 결측치는 중앙 값으로 대체하고나머지 결측치가 있는 데이터(행)을 모두 제거하고,앞에서부터 70% 데이터 중 views 컬럼의 3사분위 수에서 1사분위 수를 뺀 값을 구하시오(단, 데이터 70% 지점은 정수형(int) 변환) 👍결측치를 확인하는 방법 ➡️ df.isnull().sum() 👍 결측치 처리 후 확인 개수 확인하기 ➡️ print(df.shape) 👍 결측치가 있는 행 모두 삭제하기 ➡️ df.dropna() 👍 사분위수 구하기 ➡️ df.quantile(.25) 👍 데이터의 70% 선택하기 ➡️ df = df[:len(df)*0.7] # your codeimport pandas as pd import numpy as npdf = pd.read_csv("members... 2024. 6. 2. 빅데이터분석기사 실기 공부하기- 제1유형 : 데이터 전처리② # 빅데이터분석기사 실기 이기적 학습 내용 데이터 전처리- 문자로 된 범주형 데이터는 처리하기 편하게 숫자로 표현을 바꿈- 월요일은 1, 화요일은 2로 인코딩 시키거나, 수치 데이터의 분포를 정규화함 표준정규화- 데이터의 범위가 같아지도록 변수별로 값을 비례적으로 조정하는 과정(데이터 스케일링)- 대표적인 기법으로 표준정규화, Min-Max 정규화가 있다. 한국인 천명의 연간 육류 소비량이 53.9kg, 표준편차 5kg의 정규분포를 따르고, 일본 성인 남성 천명의 육류 소비량은 32.7kg, 표준편차 4kg의 정규분포를 따른다고 하였을때 두 집단의 육류소비량 평균이 0, 표준편차가 1인 표준정규분포로 표준화를 해본다import pandas as pdimport numpy as np#1000명의 데이터.. 2024. 6. 1. 빅데이터분석기사 실기 공부하기- 제1유형 : 데이터 전처리① ※ 빅데이터 분석기사 이기적 책을 학습한 내용 탐색적 데이터분석 (EDA: Exploratory Data Analysis) 오늘의 공부해볼 데이터는 타이타닉 데이터 ! import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf=pd.read_csv("https://raw.githubusercontent.com/YoungjinBD/dataset/main/titanic.csv") 데이터프레임의 전체 구조를 확인하는 - info()## 데이터프레임의 구조를 살펴보기 위한 함수df.info() int인 Survived는 범주형변수(Object)로 형변환을 시켜준다. - astype()df['Survived']=df['Survived'].as.. 2024. 5. 30. 빅데이터분석기사 비전공자/직장인 공부 방법 및 후기 매년 공부를 안하다가 이직을 너무 하고 싶은맘에 게을러지지않게 간만에 펜을 한 번 잡았다. 나는 이과생이지만 수학중에서 항상 통계를 제일 싫어했었고,데이터 분석 공부에 깔짝대면서 사실 나랑은 별로 안맞는다는 느낌을 받았었는데,이번 기회에 제로부터 시작하자라는 마인드로 도전해보았다. (머리가 좋다기 보단 노력파다ㅜ) 도서 선택 (이기적 빅데이터분석기사 필기) 사실 찾아보기 귀찮아서 그냥 가장 유명한 책을 샀다. 쓸데없는 내용이 너무 많다고는 했지만(TMI가 좀 많긴하다),그냥 어차피 노베이스로 시작할겸 나에게는 자세한게 좋지 하는 생각에 샀다. https://product.kyobobook.co.kr/detail/S000208505879 2024 이기적 빅데이터분석기사 필기 기본서 | 나홍석 - 교보문.. 2024. 4. 21. 이전 1 2 3 4 5 다음 728x90 반응형