본문 바로가기
Python

[ Python ] 파이썬 리스트 자료형을 통해 판다스 데이터프레임 생성하기

by teamnova 2022. 10. 21.

안녕하세요, 오늘은 파이썬의 리스트 자료형을 판다스 데이터프레임으로 변환하는 예제를 가져왔습니다.

 

판다스는 데이터 조작 및 분석을 위한 파이썬 소프트웨어 라이브러리로, 표 형태의 데이터를 다루는데 특화된 파이썬 모듈입니다.

판다스의 자료구조에는 Series(1차원), Dataframe(2차원), 그리고 Panel(3차원) 이 있습니다.

 

그 중에서 행과 열이 있는 표 형태의 2차원 자료구조인 데이터프레임을 파이썬의 리스트 자료형을 통해 생성해보겠습니다.

 

먼저 가장 간단한 형태의 데이터프레임을 생성하겠습니다.

생성에 사용한 list1의 길이가 3이므로 3행 1열의 데이터프레임이 생성되었습니다.

 

이 때 컬럼명을 입력하지 않았기 때문에 컬럼명이 자동으로 '0'으로 생성되었습니다.

데이터프레임 생성 시에 컬럼명과 함께 생성하는 방법은 다음과 같습니다.

 

 

이번에는 다수의 리스트들을 하나의 데이터프레임으로 만들어보겠습니다.

 

먼저 zip() 함수를 사용하는 방법이 있습니다.

 

zip() 함수는 여러 개의 순회 가능한(iterable) 객체를 인자로 받고, 각 객체가 담고 있는 원소를 tuple의 형태로 차례로 접근할 수 있는 반복자(iterator)를 반환합니다. 

 

간단한 예제를 통해 zip() 함수의 사용법을 알아보았습니다.

names 와 ages 라는 두 개의 리스트들을 zip 함수를 통해 엮어서 tuple 형태의 리스트로 만들어보았습니다.

 

 

위에서 생성한 data_tuples 리스트를 가지고 데이터프레임을 위와 같이 생성했습니다. Names라는 컬럼명, 그리고 Ages라는 컬럼명을 가진 4행 2열의 데이터프레임이 생성되었습니다.

 

 

 

그리고 zip() 함수를 사용하지 않고 리스트들을 dictionary 형태로 만들어서 사용하는 방법도 있습니다.

 

이상으로 파이썬 리스트 자료형을 이용해서 판다스 데이터프레임을 생성하는 방법들에 대해 간단히 알아보았습니다.