파이썬(34)
-
[Python] Pivot Table (피벗테이블)
[Python] Pivot Table (피벗테이블) groupby 집계의 다차원 버전이다. import numpy as np import pandas as pd import seaborn as sns titanic = sns.load_dataset('titanic') survived pclass sex age sibsp parch fare embarked class who adult_male deck embark_town alive alone 0 0 3 male 22 1 0 7.25 S Third man TRUE Southampton no FALSE 1 1 1 female 38 1 0 71.2833 C First woman FALSE C Cherbourg yes FALSE 2 1 3 female 26 0..
2022.04.26 -
[python] 시계열_리샘플링(resample,업샘플링,다운샘플링), 시프팅, 윈도잉
리샘플링(resample), 시프팅, 윈도잉 시계열 데이터에서 중요한 함수들 리샘플링 더 높거나, 낮은 주기로 표본들을 다시 추출(resampling) 하는 것이 중요하다. 이에 resample 함수와 asfreq함수를 사용한다 resample 기본적으로 데이터를 집계한다 asfreq 기본적으로 데이터를 선택한다 업 샘플링 분 단위, 초 단위로 샘플양을 증가시키는 리샘플링 다운샘플링 몇 일, 몇 달 단위로 샘플양을 감소시키는 리샘플링 df_resample = df.resample(rule='Y').sum() df_resample 2015-01-01, 2015-01-02... 2015-12-31 간의 데이터를 전부 더해서 다운 샘플링한다 rule 규칙 B business day frequency C cus..
2022.04.21 -
[Python] inplace = True?
네이버 사전에 의하면 \[in place (inplace) \]([https://en.dict.naver.com/#/entry/enko/f543210794ed4337aa78b9abac70cd9d](https://en.dict.naver.com/#/entry/enko/f543210794ed4337aa78b9abac70cd9d)) **1** 제자리에 (있는), …을 위한 준비가 되어 있는라는 뜻이다 inplace = True로 설정하면 기존 데이터프레임 변수에 덮어쓰게된다 예를들어 day_total_type1_2021.set_index('date',inplace = True)위와 같은 코드가 있을 때 day_total_type1_2021에 set_index함수를 설정한 데이터가 day_tota..
2022.04.21 -
[python] loc, iloc 차이
iloc - integer location의 약어로, 데이터 프레임의 행이나 칼럼의 순서를 나타내는 정수로 특정 값을 추출해오는 방법이다. loc는 칼럼명을 직접 적거나 특정 조건식을 써줌으로써 사람이 읽기 좋은 방법으로 데이터에 접근하는 방법이었다면, iloc는 컴퓨터가 읽기 좋은 방법으로(숫자로) 데이터가 있는 위치(순서)에 접근한다고 생각하면 쉬울 것이다. '0번 행, 2번 칼럼' -> df.iloc[0,2] - 정수형 값으로 데이터 추출(순서에 기반한 숫자) df.iloc[0] -> 첫번째 행이 추출된다 :pandas.core.series.Series 일반 인덱스접근으로 하면 안되는 이유 날짜 설비용량(MW) 경도 위도 발전기명 발전펌핑구분 01 02 03 04 \ 0 2021070..
2022.04.07 -
[Python] Dataframe Column Change
데이터프레임의 열 이름을 변경하는 방법으로 df.columns, df.rename # 전체 열 이름 입력하기 df.columns = ['열', '열', '열'] # 선택하여 열 이름 변경하기 df.rename(columns={'이전':'다음'})
2022.04.07 -
[Python] GroupBy 분할, 적용, 결합 (aggregate, apply, filter, transform)
# GroupBy 분할, 적용, 결합 (aggregate, apply, filter, transform) import pandas as pd df = pd.DataFrame({'key': ['A', 'B', 'C', 'A', 'B', 'C'], 'data': range(6)}, columns=['key', 'data']) df key data 0 A 0 1 B 1 2 C 2 3 A 3 4 B 4 5 C 5 GroupBy 키 값으로 합치기 df.groupby('key').sum()[28]: data1 data2 key A 3 8 B 5 7 C 7 12..
2022.04.05