Kaggle/Titanic : Machine Learning from Disaster (2) 썸네일형 리스트형 ② 데이터 분석 및 전처리 Data Analysis & Preprocessing 일단 가지고 있는 데이터를 pandas의 DataFrame을 사용했습니다. Pandas란?데이터 분석 및 처리를 쉽게 다룰수 있도록 도구를 제공하는 python 오픈소스 라이브러리 데이터 불러오기 기본적으로 필요한 모듈을 import하고 train.csv와 test.csv을 pandas를 사용해 읽어옵니다.display() 함수를 사용해서 pandas dataframe을 테이블 형식으로 출력합니다. 1234567891011121314#데이터 분석import numpy as npimport pandas as pd #시각화import seaborn as snsimport matplotlib.pyplot as plt #csv파일 train_df = pd.r.. ① Kaggle 주제 소개 Kaggle Kaggle은 2010년도에 설립된 예측모델 및 분석 대회 플랫폼입니다. kaggle에 Competitions에는 주제가 정해지고 그에 맞는 데이터를 제공함으로써 많은 팀들이 참여해 원하는 결과를 추출해 대결을 합니다.좋은 성적을 거둔 팀은 상금을 받습니다. Datasets에는 따로 주제가 정해지지 않아서 자유롭게 주제를 선정하고 결과를 추출하면 됩니다.아니면 데이터셋을 공유할 수도 있습니다. 캐글 페이지 주소 (https://www.kaggle.com/) 선택한 주제는 Titanic : Machine Learning from Disaster 입니다. Binary classification으로 처음 해보는 사람들이 하기 좋은 주제입니다. 프로그래밍 언어는 Python을 사용했습니다. 주제는 .. 이전 1 다음