본문 바로가기
데이터 사이언스/데이터 분석

<예제로 보는 Pandas> 04.파일 저장 및 열기

by 수학과인데 공대생 2023. 7. 11.
728x90

DataFrame 객체를 excel, csv, txt 등 형태의 파일로 저장하고 열어보는 작업을 해보겠습니다.

 

import pandas as pd
data = {
    '이름' : ['홍길동', '김태희', '아이유', '손흥민', '김신욱'],
    '키' : [180, 163, 165, 187, 200],
    '국어' : [90, 40, 80, 40, 15],
    '수학' : [100, 50, 70, 70, 10],
    '영어' : [85, 35, 75, 60, 20],
    '직업' : ['Thief', 'actress', 'Singer', 'Football Player', 'Football Player']    
}
data
df = pd.DataFrame(data, index = ['1번', '2번', '3번', '4번', '5번'])
df

 

이전 포스팅에서 사용했던 data_frame입니다.

 

 

csv 파일로 저장

위 데이터프레임을 csv파일로 저장해보겠습니다.

 

-> code : df.to_csv('data.csv', encoding = 'utf-8-sig')

df.to_csv('data.csv', encoding = 'utf-8-sig')

 

Folder에 접근에 csv파일로 저장되었는지 확인해 보겠습니다.

 

index를 삭제한 상태로 csv파일에 저장할 수도 있습니다. -> index = False

df.to_csv('data.csv', encoding = 'utf-8-sig', index = False)

 

 

txt 파일로 저장

-> code : df.to_csv('data.txt', sep = '\t')

df.to_csv('data.txt', sep = '\t') # tab 으로 구분

tab으로 구분

 

 

excel 파일로 저장

-> code : df.to_excel('data.xlsx')

df.to_excel('data.xlsx')

 

 


data_frame을 저장하는 법을 알았으니 pandas를 이용해 불러오는 작업도 가능합니다.

 

csv파일 열기

df = pd.read_csv('data.csv')
df

 

지정된 개수 만큼 행을 건너 뛰고 불러올 수도 있습니다.

skiprows = n 이라고 한다면 n개의 행을 skip하고 데이터를 불러옵니다.

-> code : df = pd.read_csv('data.csv', skiprows = 'n')

 

df = pd.read_csv('data.csv', skiprows = 2)
df

홍길동과 김태희를 제외한 나머지 정보들이 출력되었습니다.

 

개수를 지정하는 것이 아닌 특정 행을 skip하는 것도 가능합니다.

-> code : df = pd.read_csv('data.csv', skiprows = [list])

 

df = pd.read_csv('data.csv', skiprows = [0, 3])
df

 

행을 skip할 수도 있지만

지정된 row만 불러오는 것도 가능합니다.

nrows = n 으로 하면 n개의 행을 불러옵니다.

-> code : df = pd.read_csv('data.csv', nrows = n

 

df = pd.read_csv('data.csv', nrows = 3)
df

 

728x90