본문 바로가기
# 연구실

데이터프레임 CSV 데이터프레임

by lakedaimong 2022. 6. 27.

지난번 시간에 간단히 딕셔너리를 만들어보고 그 딕셔너리를 이용하여 데이터프레임을 생성해 보았습니다. 앞으로 데이터 분석을 위한 기초로 활용될 기술인데요. 몇 줄 안되는 데이터를 가지고 데이터를 분석한다고 할 수는 없겠죠? 엑셀에서 포맷으로 저장할 수 있는 CSV 파일을

데이터 자료로 활용하게 될텐데요. python에서 만든 데이터 프레임을 csv 파일로 내보내거나 csv 파일을 python 데이터프레임으로 가져올 수도 있습니다.

 

판다스 pandas 와 데이터프레임 기초

판다스 pandas는 파이썬에서 데이터 분석을 위해 사용되는 필수 패키지 중 하나입니다. 판다스가 제공하는 2차원 테이블 형태 구조인 "데이터프레임"은 주로 데이터를 읽어서 저장하고 그 데이블

blog.arecacoco.com

먼저 지난번 실습한 자료를 CSV 파일로 만들어 보겠습니다.

import pandas as pd

table_01 = {'code' : [101, 102, 103, 104, 105, 106, 107, 108, 109],
         '과목' : ['과학', '국어', '영어', '체육', '수학', '사회', '윤리', '과학', '역사'],
         '수강생' : [36, 29, 15, 63, 33, 57, 30, 42, 40],
         '선생님' : ['바나클', '콰지', '페이소', '튜닙', '셀링턴', '핀토', '트윅', '보리스', '대쉬']}

table_02 = {'code' : [110, 111],
            '과목' : ['NFT', '핀테크'],
            '수강생' : [1000, 429],
            '선생님' : ['도로시', '엘리스']}

df_01 = pd.DataFrame(table_01)
df_02 = pd.DataFrame(table_02)
total_df = pd.concat([df_01, df_02])

print(total_df)

total_df.to_csv('data.csv', index=False)

CSV 파일로 내보내는 명령어는 마지막 한줄입니다. 병합된 데이터프레임이 담긴 total_df에 .to_csv 명령을 통해 csv파일을 생성하면 프로젝트 파일이 있는 폴더에 내가 지정한 파일명 data.csv 이름으로 파일이 생성됩니다.

데이터프레임 csv로 내보내기

그림과 같이 깔끔하게 내보내기가 되었습니다. 이번에는 반대로 만들어진 파일을 pycharm으로 가져와 보겠습니다.

import pandas as pd

bring_df = pd.read_table('data.csv', sep=',')
print(bring_df)

판다스에서 pd.read_table 함수를 사용하면 프로젝트 폴터에 있는 csv 파일을 가져올 수 있습니다. 가져온 파일은 pycharm에서 아래와 같이 정상적으로 출력되는 것을 확인할 수 있습니다.

    code   과목   수강생  선생님
0    101   과학    36  바나클
1    102   국어    29   콰지
2    103   영어    15  페이소
3    104   체육    63   튜닙
4    105   수학    33  셀링턴
5    106   사회    57   핀토
6    107   윤리    30   트윅
7    108   과학    42  보리스
8    109   역사    40   대쉬
9    110  NFT  1000  도로시
10   111  핀테크   429  엘리스

Photo by Mika Baumeister on Unsplash

   
반응형

댓글