728x90
오늘은 자바스크립트를 이용해 csv 파일의 대량 데이터를 일괄적으로 편집하는 기능을
사용해보려고합니다
Pandas 는 파이썬에서 제공하는 분석 라이브러리로, 데이터 분석에 있어서 다양한 기능을 제공합니다
먼저 오늘 사용할 데이터는 전국 치안센터의 위치 데이터입니다.
자료 확장자명은 csv 이고 데이터는 공공데이터 포털에서 다운 받으실 수 있습니다.
https://www.data.go.kr/data/15076962/fileData.do
현재 보고 계신 데이터에는 주소 입력간에 어느 시 인지 알수가 없습니다.
지오코딩을 할때에는 필요하지 않을 수도 있으나
오늘은 문자열 데이터 추가 실습을 진행하기 위해 '서울특별시' 를 넣어주도록 하겠습니다.
import pandas as pd
df = pd.read_csv('통합 문서1.csv', encoding='cp949', low_memory=False)
# 컬럼 이름 확인
print(df.columns)
num_rows = len(df) # 또는 df.shape[0]
print(num_rows)
# astype(str) 사용하여서
# '주소' 칼럼 앞에 '서울특별시 ' 붙이기
df['주소'] = '서울특별시 ' + df['주소'].astype(str)
## 변경된 데이터 저장
df.to_csv('통합 문서3.csv', encoding='cp949', index=False)
astype (String) 을 사용하여
주소 라는 이름을 가진 컬럼에 전부 맨앞에 '서울 특별시' 를 추가할 수 있습니다.
결과 화면은 아래와 같습니다
감사합니다
'Python' 카테고리의 다른 글
[Python] 판다스 (Pandas) 라이브러리 사용하여 데이터의 합계, 최대값, 평균, 비율 계산하기 (0) | 2024.11.01 |
---|---|
[Python] 사이킷런(scikit-learn) 라이브러리를 활용하여 정규화 하기 Min-Max Scaling (0) | 2024.10.26 |
[Python] 카카오 API 사용해서 도로명 주소를 위도, 경도 좌표로 반환하기 (Geocoding) (2) | 2024.10.14 |
[Python] random 모듈의 다양한 기능 (0) | 2024.08.25 |
[Python] 다양한 문자열 연결(포매팅) 방법 (0) | 2024.08.19 |