데이터사이언스/머신러닝 3

Logistic Regression - 당뇨병예측

로지스틱 회귀를 활용해 피마 인디언 당뇨병을 예측해보려고 합니다. UCI Machine Learning에서 제공하는 피마 인디언 당뇨병 데이터를 갖고 Classfication 실습을 해보았습니다. https://archive.ics.uci.edu/ml/index.php 📌데이터 수집 및 전처리 코드는 Colab에서 작성하였고 Drive에 csv파일을 올려두었습니다. 필요한 라이브러리들을 모두 불러와줍니다. 데이터 처리를 위한 Pandas, Numpy 시각화 라이브러리 plotly 머신러닝 프레임워크인 sklearn 교차 검증을 위한 cross_val_score, KFold 평가를 위한 accuracy_score, precision_score, recall_score import pandas as pd i..

NBA 농구 강팀이 연승하는 이유는?

🛒데이터 수집 및 전처리 데이터는 캐글에 있는 NBA Regular Season Data를 사용하였습니다. https://www.kaggle.com/michaelmcfarlane/20172018-nba-regular-season-game-data 사용할 라이브러리와 파일을 불러오겠습니다. import pandas as pd import numpy as np import plotly.express as px import plotly.graph_objects as go import matplotlib.pyplot as plt import seaborn as sns from sklearn.cluster import KMeans from sklearn.preprocessing import MinMaxScaler..

📈Regression 중고차 거래가 예측하기

📊데이터 전처리 및 시각화 Kaggle에 있는 데이터로 중고차 거래가를 예측하는 프로젝트를 해보았습니다. https://www.kaggle.com/adityadesai13/used-car-dataset-ford-and-mercedes 사용한 라이브러리는 Scikit-learn, Pandas, Numpy와 시각화 라이브러리인 Matplotlib, Seaborn, Plotly를 사용하였고 실행환경은 Colab에서 진행하였습니다. 우선 여러 개의 파일을 UK_car.csv라는 하나의 파일로 합쳐 주었습니다. import pandas as pd import numpy as np import dill as pickle import matplotlib.pyplot as plt import plotly.express..