pandas 2

Pandas - 데이터프레임 생성/병합/추출하기

파이썬은 원래 데이터 분석에 특화된 언어가 아닙니다. R로 분석하던 것을 파이썬으로 하고 싶은 개발자들이 만든 도구가 Numpy와 Pandas입니다. 데이터분석을 위한 파이썬의 기본 자료구조 딕셔너리, 리스트만으로는 부족했기 때문에, Pandas에는 데이터프레임, 시리즈라는 자료구조가 추가되었습니다. 1. 데이터 프레임 생성 데이터 프레임을 만드는 방법은 여러 가지가 있습니다. 일반적으로 배열, 리스트, 딕셔너리로 만들 수 있습니다. 1.1. 배열로 생성하기 첫 번째는 배열(array)을 이용해서 만드는 방법입니다. 우선 배열 자료구조를 사용하기 위해 numpy를 불러오고, pandas도 import 합니다. import pandas as pd import numpy as np sample_array =..

📈Regression 중고차 거래가 예측하기

📊데이터 전처리 및 시각화 Kaggle에 있는 데이터로 중고차 거래가를 예측하는 프로젝트를 해보았습니다. https://www.kaggle.com/adityadesai13/used-car-dataset-ford-and-mercedes 사용한 라이브러리는 Scikit-learn, Pandas, Numpy와 시각화 라이브러리인 Matplotlib, Seaborn, Plotly를 사용하였고 실행환경은 Colab에서 진행하였습니다. 우선 여러 개의 파일을 UK_car.csv라는 하나의 파일로 합쳐 주었습니다. import pandas as pd import numpy as np import dill as pickle import matplotlib.pyplot as plt import plotly.express..