728x90
안녕하세요 오늘은 파이썬에서 제공하는 데이터 분석 라이브러리인 판다스(Pandas) 를 사용하여
합계, 최대값, 평균, 비율을 계산해보겠습니다.
위 예시 데이터를 활용할 예정입니다.
총 판매량과 평균 판매량, 최대 판매량과 지역별 판매 비율을 확인해보겠습니다
import pandas as pd
# CSV 파일 불러오기
df = pd.read_csv('complex_sales_data.csv')
# 날짜를 datetime 형식으로 변환
df['날짜'] = pd.to_datetime(df['날짜'])
# 월별로 데이터 그룹화
monthly_grouped = df.groupby(df['날짜'].dt.to_period('M')).agg(
총판매량=('판매량', 'sum'),
평균판매량=('판매량', 'mean'),
최대판매량=('판매량', 'max'),
지역별판매비율=('지역', lambda x: x.value_counts(normalize=True).to_dict())
).reset_index()
# 출력
print(monthly_grouped)
감사합니다
'Python' 카테고리의 다른 글
[Python] 사이킷런(scikit-learn) 라이브러리를 활용하여 정규화 하기 Min-Max Scaling (0) | 2024.10.26 |
---|---|
[Python] 판다스 (Pandas) 라이브러리 사용해서 csv 데이터 특정 칼럼에 문자열 추가하기 (0) | 2024.10.20 |
[Python] 카카오 API 사용해서 도로명 주소를 위도, 경도 좌표로 반환하기 (Geocoding) (2) | 2024.10.14 |
[Python] random 모듈의 다양한 기능 (0) | 2024.08.25 |
[Python] 다양한 문자열 연결(포매팅) 방법 (0) | 2024.08.19 |