DataFrame 객체를 excel, csv, txt 등 형태의 파일로 저장하고 열어보는 작업을 해보겠습니다.
import pandas as pd
data = {
'이름' : ['홍길동', '김태희', '아이유', '손흥민', '김신욱'],
'키' : [180, 163, 165, 187, 200],
'국어' : [90, 40, 80, 40, 15],
'수학' : [100, 50, 70, 70, 10],
'영어' : [85, 35, 75, 60, 20],
'직업' : ['Thief', 'actress', 'Singer', 'Football Player', 'Football Player']
}
data
df = pd.DataFrame(data, index = ['1번', '2번', '3번', '4번', '5번'])
df
이전 포스팅에서 사용했던 data_frame입니다.
csv 파일로 저장
위 데이터프레임을 csv파일로 저장해보겠습니다.
-> code : df.to_csv('data.csv', encoding = 'utf-8-sig')
df.to_csv('data.csv', encoding = 'utf-8-sig')
Folder에 접근에 csv파일로 저장되었는지 확인해 보겠습니다.
index를 삭제한 상태로 csv파일에 저장할 수도 있습니다. -> index = False
df.to_csv('data.csv', encoding = 'utf-8-sig', index = False)
txt 파일로 저장
-> code : df.to_csv('data.txt', sep = '\t')
df.to_csv('data.txt', sep = '\t') # tab 으로 구분
excel 파일로 저장
-> code : df.to_excel('data.xlsx')
df.to_excel('data.xlsx')
data_frame을 저장하는 법을 알았으니 pandas를 이용해 불러오는 작업도 가능합니다.
csv파일 열기
df = pd.read_csv('data.csv')
df
지정된 개수 만큼 행을 건너 뛰고 불러올 수도 있습니다.
skiprows = n 이라고 한다면 n개의 행을 skip하고 데이터를 불러옵니다.
-> code : df = pd.read_csv('data.csv', skiprows = 'n')
df = pd.read_csv('data.csv', skiprows = 2)
df
홍길동과 김태희를 제외한 나머지 정보들이 출력되었습니다.
개수를 지정하는 것이 아닌 특정 행을 skip하는 것도 가능합니다.
-> code : df = pd.read_csv('data.csv', skiprows = [list])
df = pd.read_csv('data.csv', skiprows = [0, 3])
df
행을 skip할 수도 있지만
지정된 row만 불러오는 것도 가능합니다.
nrows = n 으로 하면 n개의 행을 불러옵니다.
-> code : df = pd.read_csv('data.csv', nrows = n
df = pd.read_csv('data.csv', nrows = 3)
df
'데이터 사이언스 > 데이터 분석' 카테고리의 다른 글
<예제로 보는 Pandas> 03. Index (0) | 2023.07.10 |
---|---|
<예제로 보는 Pandas> 02. DataFrame (0) | 2023.07.10 |
<예제로 보는 Pandas> 01. Series (0) | 2023.07.10 |