본문 바로가기
# 연구실

데이터 분석 도구 준비 - 코랩

by lakedaimong 2022. 7. 23.

본격적으로 데이터 분석을 실습해 보기 전에 먼저 데이터 분석을 할 도구가 필요합니다. 물론 데이터 분석을 위한 코드는 파이썬 python을 사용하지만 파이썬 작성할 도구가 필요합니다. 마치 글을 쓰려면 공책이나 노트북이 있어야 하는 것처럼요. 지난번에 그 도구 중 하나로 파이참 pycharm에 대해 소개한 적이 있습니다.

 

파이참 pycharm 설치 및 설정

파이참 pycharm 은 파이썬 python 코딩을 도와주는 통합 개발 환경(IDE) 입니다. 통합 개발 환경 IDE란 공통된 개발자 툴을 하나의 그래필 사용자 인터페이스GUI로 결합하는 애플리케이션을 구축하기

blog.arecacoco.com

 파이참도 많이 사용하고 다양한 기능을 제공하는 IDE지만 앞으로 하게 될 데이터를 분석하고 분석된 데이터를 시각화하는 데는 지금 소개드릴 '코랩'이 더 적합합니다. 코랩도 아주아주 유명하죠. 아마 나만 몰랐던 것일 수도...;;

 

Welcome To Colaboratory

Run, share, and edit Python notebooks

colab.research.google.com

 

코랩? 무엇에 쓰는 물건인고?

코랩은 구글에서 제공하는 파이썬 개발 환경입니다. 온라인에서 작동하고 그리서 내 PC를 리소스를 잡아먹지도 않고, 어디에서나 별도의 설치 없이 코딩을 할 수 있으며, 게다가 공짜입니다. 유료버전이 있긴 하지만 무료만 사용해도 충분합니다.

(개인적으로 이런 걸 보면 구글이 무섭습니다. 구글이 없으면 컴퓨터로 할 수 있는 게 별로 없을 듯;;)

 

코랩 colab이란 Colaboratory를 줄여서 부르는 이름이고 브라우저 내에서 python 스크립트를 작성하고 실행할 수 있다고 소개되어 있네요. 

  • 구성이 필요하지 않음
  • GPU 무료 액세스
  • 간편한 공유

코랩 화면

화면 구성은 위와 같습니다. 코랩은 구글 계정만 있으면 사용이 가능하고, 파이참에서 하나의 프로젝트가 위와 같이 표시됩니다. 코랩에서는 메모장이라고 표현하네요. 파이참과 비교하자면 맨 위에 코랩 로고 엽에 있는 'Untitled4.ipynb'가 프로젝트 이름입니다. 이 프로젝트는 연결된 구글 계정의 클라우드 드라이브에 저장됩니다. 

   

그 아래에 더 진한 검은색 라인이 코드를 입력하는 창입니다. 그 창 왼쪽에 '실행' play 버든이 있는데 여기에 작성된 코드를 실행시켜 줍니다. 이 라인은 계속 만들 수 있고 각 라인은 별도로 실행됩니다. 파이참으로 볼 때 하나의 프로젝트 내에서 각각의 탭들과 같다고 보시면 되는데 아주 편리합니다.

색인 기능

편리한 이유는 색인 기능을 제공하기 때문인데요. 위 화면과 같이 내가 찾아가고 싶은 위치에 '텍스트' 추가하기를 클릭한 다음 입력하는 텍스트 앞에 #을 붙여주면 자동으로 목차로 만들어 줍니다. 마크다운에서 제공하는 기능과 비슷하죠.

 

코랩 제한

코랩은 colab은 온라인에서 리소스를 무료로 다 같이 사용하기 때문에 일괄 연산, 다른 사용자에게 부정적인 영향을 줄 수 있는 작업 또는 구글 정책을 우회하는 작업 등을 금지하고 있습니다. 다음은 코랩 런타임에서 허용하지 않는 사항들입니다.

  • 코랩과의 상호작용 연산과 관련이 없는 파일 호스팅, 미디어 게재 또는 기타 웹 서비스 제공
  • 토렌트 다운로드 또는 P2P 파일 공유 참여
  • 원격 데스크톱 또는 SSH 사용
  • 원격 프록시 연결
  • 암호화폐 채굴
  • 서비스 거부 공격 실행
  • 비밀번호 크래킹
  • 여러 계정을 사용하여 액세스 제한이나 리소스 사용 제한 우회
  • 딥 페이크 생성

 

코딩에 관심을 가지고 문제점을 해결하기 위해 구글링을 해보신 분이라면 고수의 분위기가 나는 홈페이지에 '주피터 노트북으로 작성된 포스팅입니다'와 같은 문구를 보신 적이 있으실 겁니다. 이 주피터 노트북을 한 번 본 적이 있다면 코팹이 유사하다는 생각이 들텐데요. 쥬피터 jupyter는 코랩의 기반이 되어 주는 오픈소스 프로젝트입니다. 뿌리가 같다는 거죠. 다만 코랩을 사용하면 아무것도 다운로드 하거나 설치, 실행하지 않고도 쥬피터 메모장을 사용하고 다른 사람들과 공유도 쉽게 할 수 있습니다.

 

앞으로

다음 포스팅부터 코랩 환경에서 파이썬을 이용하여 데이터 분석을 해 볼 예정입니다. 개인적인 생각으로 코드를 소개하는 포스팅 대부분이 코드 자체의 기능에 초점이 맞춰져 있는 듯합니다. 파이썬을 이용하려면 물론 코드에 대한 기능을 우선적으로 알아야 하겠지만 저도 코딩을 공부하면서 이거 어디다 써먹지? 하는 생각을 많이 했던 거 같습니다. 그래서 쓰임이 있는, 그 결과물을 활용할 수 있는 주제를 정하여 포스팅을 진행해 볼까 합니다. 내가 재미있는 것으로 ㅎㅎ

반응형

댓글