본문 바로가기

반응형
SMALL

Machine, Deep Learning/Machine, Deep Learning 실습

Kaggle - Heart Disease Dataset (1) 이번엔 Heart Disease의 데이터를 시각화, 분석을 해보도록 하겠습니다. 된다면 Machine Learning 모델링도 해보도록 하겠습니다. 데이터는 Kaggle Datasets에서의 Heart Disease에서 참고했습니다. 모델링까지 하게된다면 Kaggle의 Kernels를 참고하겠습니다. 데이터의 License는 Reddit API Terms에 있습니다. 이 데이터 셋은 원래라면 76개의 속성을 가지고 있어야하지만, 공공연 적인 사용을 위한 14개로 축소하여 배포되었습니다. "목표" 필드는 환자의 심장 질환의 존재를 나타내고 0에서 4까지의 정수로 표현되어 있습니다. 0이 환자 중에 심장 질환을 가지고 있지 않음을 나타냅니다. 우선 필요한 라이브러리를 불러오도록 하겠습니다. import pa.. 더보기
Kaggle - MINST 예측 모델 생성 by Keras (2) 본 글은 Kaggle MINST Competition에서의 Introduction to CNN Keras - 0.997 (top 6%)의 커널을 참고하여 작성하였습니다. 1. 소개 (Introduction) 2. 데이터 준비 (Data Preparation) 2.1 데이터 로드 (Data Load) 2.2 널 데이터 확인 (Check for null and missing values) 2.3 데이터베이스 정규화 (Normalization) 2.4 재구조화 (Reshape) 2.5 라벨 인코딩 (Label Encoding) 2.6 훈련과 확인 셋 나누기 (Split training and valdiation set) 3. CNN 3.1 모델 정의 (Define the model) 3.2 최적화 (Set t.. 더보기
Kaggle - MINST 예측 모델 생성 by Keras (1) 본 글은 Kaggle MINST Competition에서의 Introduction to CNN Keras - 0.997 (top 6%)의 커널을 참고하여 작성하였습니다. 1. 소개 (Introduction) 2. 데이터 준비 (Data Preparation) 2.1 데이터 로드 (Data Load) 2.2 널 데이터 확인 (Check for null and missing values) 2.3 데이터베이스 정규화 (Normalization) 2.4 재구조화 (Reshape) 2.5 라벨 인코딩 (Label Encoding) 2.6 훈련과 확인 셋 나누기 (Split training and valdiation set) 3. CNN 3.1 모델 정의 (Define the model) 3.2 최적화 (Set t.. 더보기
Kaggle - 타이타닉 생존여부 예측 모델 생성 (2) Kaggle - 타이타닉 생존여부 예측 모델 생성 (2) import numpy as np import pandas as pd from pandas import Series import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) # 위 두 줄은 알아두는 것이 좋습니다. matplotlib의 기본 scheme 말고 seaborn scheme을 세팅합니다. # 일일이 graph의 font size를 지정할 필요 없이 seaborn의 font_scale을 사용하면 편합니다. # import plotly.offline as py # py.init_notebook_mode(connect.. 더보기
Kaggle - 타이타닉 생존여부 예측 모델 생성 (1) 본 글은 머신러닝, 데이터 사이언스를 처음 접하는 이(본인)를 위한 Kaggle의 튜토리얼을 하는 글입니다. 본 글에선 python을 사용할 것이고 라이브러리론 시각화 도구(matplotlib, seaborn, plotly), 데이터 분석 도구(pandas, numpy), 머신 러닝 도구(sklearn)을 사용할 것입니다. 본 글에선 타이타닉에 탑승한 사람들의 신상정보를 활용하여, 승선한 사람들의 생존여부를 예측하는 모델을 생성할 것입니다. import numpy as np import pandas as pd # pandas는 Python에서 테이블화 된 데이터를 다루는 데 가장 최적화되어 있는 라이브러리입니다. # Python으로 데이터분석을 한다고 하면 반드시 능숙해져야 할 라이브러리이니, 여러 커널.. 더보기

반응형
LIST