pandas

날짜 다루기다음으로, 날짜를 다루는 방법에 대해 알아보겠습니다. 날짜가 문자형으로 되어 있다면 날짜 계산이 불가능합니다. 날짜를 날짜형 데이터로 변경해주어야 날짜를 계산할 수 있습니다. 데이터를 날짜 형태로 변경하기 위해서는 pd.to_datetime() 함수를 사용합니다.pd.to_datetime(df['Date'], format='%Y-%m-%d')# Date datetime64[ns] to_datetime()의 인자로 날짜형으로 변경을 원하는 컬럼을 넣어줍니다. 이때, format을 통해 날짜의 포맷을 지정해줄 수 있습니다. 다음 표는, 자주 사용하는 데이터 형식입니다.형식설명%Y0을 채운 4자리 연도%y0을 채운 2자리 연도%m0을 채운 월%d0을 채운 일%H0을 채운 시간%M0을 채운 분%S..
이번에는 Pandas로 데이터를 가공하는 방법에 대해 알아보겠습니다. import pandas as pdfile_path = './data/titanic_train.csv'df = pd.read_csv(file_path) 인덱스, 행, 열인덱스인덱스는 데이터프레임에서 각 행의 이름입니다.df.index# RangeIndex(start=0, stop=891, step=1)# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, ..., 890] rename() 함수를 이용해서 원하는 인덱스의 이름을 변경할 수 있습니다. index = 바꿀 인덱스명을 이용하면 데이터 전체의 인덱스를 변경합니다.df.rename({0:'row1', 1:'row2'})df.index = df1.index = ['row' + ..
Pandas란?Pandas는 빠르고 강력하며 유연하고 사용하기 쉬운 오픈 소스 데이터 분석 및 조작 도구로, 파이썬 프로그래밍 언어를 기반으로 구축되었습니다. Pandas는 데이터를 쉽고 빠르게 정렬하거나 인덱싱할 수 있고, 그루핑, 피봇팅과 같은 고급 기능을 제공합니다. 또한, join을 통해 데이터를 병합하고, 요약하거나 통계를 구하기도 쉽습니다. import pandas as pd pandas의 별칭은 통상적으로 pd로 칭합니다. Series와 DataFrame 이해하기SeriesSeries(이하 시리즈)는 pandas에서 사용하는 일종의 리스트입니다. 파이썬의 딕셔너리와 리스트 타입의 데이터를 시리즈로 만들 수 있습니다. dic = {'a': 'apple','b': 'cherry','c': 'ba..
hyunseo
'pandas' 태그의 글 목록