본문 바로가기

판다스4

[Python] pandas.concat() 함수로 데이터프레임 합치기 오늘은 pandas.concat() 함수를 사용하여 데이터프레임들을 합치는 방법을 알아보겠습니다. pandas.concat() 함수는 기본적으로 시리즈나 데이터프레임과 같은 판다스 객체들을 특정 방향(축)으로 이어붙이는 함수입니다. 문법은 다음과 같습니다. pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True) 아래는 자주 사용되는 파라미터들에 대한 설명입니다. objs : a sequence or mapping of Series or DataFrame objects 이어붙일 시리즈/데이터프레임들을.. 2023. 1. 7.
[ Python ] csv 파일을 불러와서 판다스 데이터프레임 생성하기 안녕하세요, 오늘은 csv 파일을 불러와서 판다스 데이터프레임을 생성해보겠습니다. 사용할 csv 파일은 공공데이터포털에서 다운로드 받은 '서울특별시 송파구_체육시설' 데이터 (csv파일) 를 사용하겠습니다. pd.read_csv() 함수를 사용하면 csv, text 등의 형식의 파일들을 불러와서 데이터프레임으로 생성할 수 있습니다. import pandas as pd df = pd.read_csv('서울특별시 송파구_체육시설_20210916.csv') 하지만 위의 코드를 실행하면 다음과 같은 에러가 발생합니다. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte 이는 데이터 내에 한글이 포함되어.. 2022. 12. 29.
[ Python ] 판다스 데이터프레임을 csv 파일로 저장하기 안녕하세요, 오늘은 판다스 데이터프레임을 csv 파일로 저장해보겠습니다. 먼저 간단한 형태의 데이터프레임을 생성하겠습니다. import pandas as pd names = ['Kim', 'Park', 'Lee', 'Shin'] ages = [25, 29, 21, 33] address = ['서울', '대구', '춘천', '제주'] dictionary = { 'Name' : names, 'Age' : ages, 'Address' : address } df = pd.DataFrame(dictionary) 생성된 데이터프레임은 다음과 같습니다. 가장 간단한 형태로 데이터프레임을 csv 파일로 저장하는 방법은 다음과 같습니다. df.to_csv('file_name.csv') 파일이 현재 경로에 저장이 되고, .. 2022. 12. 20.
[ Python ] 파이썬 리스트 자료형을 통해 판다스 데이터프레임 생성하기 안녕하세요, 오늘은 파이썬의 리스트 자료형을 판다스 데이터프레임으로 변환하는 예제를 가져왔습니다. 판다스는 데이터 조작 및 분석을 위한 파이썬 소프트웨어 라이브러리로, 표 형태의 데이터를 다루는데 특화된 파이썬 모듈입니다. 판다스의 자료구조에는 Series(1차원), Dataframe(2차원), 그리고 Panel(3차원) 이 있습니다. 그 중에서 행과 열이 있는 표 형태의 2차원 자료구조인 데이터프레임을 파이썬의 리스트 자료형을 통해 생성해보겠습니다. 먼저 가장 간단한 형태의 데이터프레임을 생성하겠습니다. 생성에 사용한 list1의 길이가 3이므로 3행 1열의 데이터프레임이 생성되었습니다. 이 때 컬럼명을 입력하지 않았기 때문에 컬럼명이 자동으로 '0'으로 생성되었습니다. 데이터프레임 생성 시에 컬럼명과.. 2022. 10. 21.