본문 바로가기
Python

[Python] 판다스 (Pandas) 라이브러리 사용해서 csv 데이터 특정 칼럼에 문자열 추가하기

by teamnova 2024. 10. 20.
728x90

 

오늘은 자바스크립트를 이용해 csv 파일의 대량 데이터를 일괄적으로 편집하는 기능을

사용해보려고합니다 

Pandas 는 파이썬에서 제공하는 분석 라이브러리로, 데이터 분석에 있어서 다양한 기능을 제공합니다  

 

 

먼저 오늘 사용할 데이터는 전국 치안센터의 위치 데이터입니다. 

자료 확장자명은 csv 이고 데이터는 공공데이터 포털에서 다운 받으실 수 있습니다. 

https://www.data.go.kr/data/15076962/fileData.do 

 

경찰청_전국 치안센터 주소 현황_20240630

경찰청 전국 치안센터 주소를 아래와 같이 현행화하였습니다.<br/>(시도청, 경찰서, 관서명, 지역파출소, 치안센터명, 주소)

www.data.go.kr

 

 

현재 보고 계신 데이터에는 주소 입력간에 어느 시 인지 알수가 없습니다.

지오코딩을 할때에는 필요하지 않을 수도 있으나 

오늘은 문자열 데이터 추가 실습을 진행하기 위해 '서울특별시' 를 넣어주도록 하겠습니다. 

 

 

import pandas as pd
df = pd.read_csv('통합 문서1.csv', encoding='cp949', low_memory=False)
# 컬럼 이름 확인
print(df.columns)

num_rows = len(df)  # 또는 df.shape[0]
print(num_rows)


# astype(str) 사용하여서
# '주소' 칼럼 앞에 '서울특별시 ' 붙이기
df['주소'] = '서울특별시 ' + df['주소'].astype(str)

## 변경된 데이터 저장
df.to_csv('통합 문서3.csv', encoding='cp949', index=False)

 

astype (String) 을 사용하여 

주소 라는 이름을 가진 컬럼에 전부 맨앞에 '서울 특별시' 를 추가할 수 있습니다. 

 

 

결과 화면은 아래와 같습니다 

 

감사합니다