Python
[Python] 판다스 (Pandas) 라이브러리 사용하여 데이터의 합계, 최대값, 평균, 비율 계산하기
teamnova
2024. 11. 1. 18:59
728x90
안녕하세요 오늘은 파이썬에서 제공하는 데이터 분석 라이브러리인 판다스(Pandas) 를 사용하여
합계, 최대값, 평균, 비율을 계산해보겠습니다.
위 예시 데이터를 활용할 예정입니다.
총 판매량과 평균 판매량, 최대 판매량과 지역별 판매 비율을 확인해보겠습니다
import pandas as pd
# CSV 파일 불러오기
df = pd.read_csv('complex_sales_data.csv')
# 날짜를 datetime 형식으로 변환
df['날짜'] = pd.to_datetime(df['날짜'])
# 월별로 데이터 그룹화
monthly_grouped = df.groupby(df['날짜'].dt.to_period('M')).agg(
총판매량=('판매량', 'sum'),
평균판매량=('판매량', 'mean'),
최대판매량=('판매량', 'max'),
지역별판매비율=('지역', lambda x: x.value_counts(normalize=True).to_dict())
).reset_index()
# 출력
print(monthly_grouped)
감사합니다