Python 25

random 모듈

import random 스탠다드 라이브러리에 있는 random 모듈은 랜덤한 숫자를 생성하기 위한 다양한 함수들을 제공해 줍니다. randint 함수 randint는 두 수 사이의 어떤 랜덤한 정수를 리턴하는 함수입니다. randint(a, b)를 하면, a ≤ N ≤ b를 만족하는 어떤 랜덤한 정수 N을 리턴하는 것이죠. import random print(random.randint(1, 20)) print(random.randint(1, 20)) print(random.randint(1, 20)) print(random.randint(1, 20)) print(random.randint(1, 20)) 8 3 6 6 2 1 이상, 20 이하의 수 다섯 개를 출력했는데요. 보시다시피 매번 다른 랜덤한 수..

Python 2020.11.23

리스트와 문자열 정리

리스트와 문자열은 굉장히 비슷합니다. 리스트가 어떤 자료형들의 나열이라면, 문자열은 문자들의 나열이라고 할 수 있겠죠. 지금부터 파이썬에서 리스트와 문자열이 어떻게 같고 어떻게 다른지 알아봅시다. 인덱싱 (Indexing) 두 자료형은 공통적으로 인덱싱이 가능합니다. # 알파벳 리스트의 인덱싱 alphabets_list = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'] print(alphabets_list[0]) print(alphabets_list[1]) print(alphabets_list[4]) print(alphabets_list[-1]) # 알파벳 문자열의 인덱싱 alphabets_string = 'ABCDEFGHIJ' print(alphabets_s..

Python/Data science 2020.11.23

리스트 팁

리스트에서 값의 존재 확인하기 어떤 값이 리스트에 있는지 확인하는 함수를 써보겠습니다. # value가 some_list의 요소인지 확인 def in_list(some_list, value): i = 0 while i < len(some_list): # some_list에서 value를 찾으면 True를 리턴 if some_list[i] == value: return True i = i + 1 # 만약 some_list에서 value를 발견하지 못했으면 False를 리턴 return False # 테스트 primes = [2, 3, 5, 7, 11, 13, 17, 19, 23] print(in_list(primes, 7)) print(in_list(primes, 12)) True False 쓰는데 아주 ..

Python/Data science 2020.11.23

데이터 다운로드 받기

데이터를 구하는 가장 쉬운 방법은, 이미 누군가 만들어둔 데이터를 사용하는 것입니다. 대표적으로, 국가 기관에서는 공익 목적으로 여러 데이터를 공개합니다. 그 외에도 데이터를 검색하는 사이트나, 데이터를 공유하는 사이트들이 있죠. 국내 사이트 서울열린데이터광장 https://data.seoul.go.kr/ 공공데이터포털 https://www.data.go.kr e-나라지표 http://www.index.go.kr/ 국가통계포털 http://kosis.kr 서울특별시 빅데이터 캠퍼스 https://bigdata.seoul.go.kr/ 통계청 http://kostat.go.kr/ 각 사이트를 보면, 여러 분야의 데이터를 다운로드 받을 수 있습니다. 혹은 원하는 데이터를 신청하면 제공해주기도 합니다. 그 외에..

Python/Data science 2020.11.18

상관 계수 시각화

학생들의 시험 점수 데이터가 있습니다. 데이터 사이의 상관 계수를 살펴봅시다. DataFrame의 corr() 메소드를 사용하면, 숫자 데이터 사이의 상관 계수를 보여줍니다. %matplotlib inline import pandas as pd df = pd.read_csv('data/exam.csv') df.corr() 상관 계수도 DataFrame 형태로 출력됩니다. 하지만 숫자가 많다보니 한눈에 잘 들어오지 않을 수 있는데요. 이럴 때 히트맵을 사용합니다. 히트맵은 상관 계수를 시각화하는 대표적인 방법입니다. 상관 계수는 시각화해서 보는 경우가 많습니다. Seaborn을 이용하면 히트맵을 그릴 수 있습니다. 상관 계수의 결과를 Seaborn의 heatmap 메소드에 넘겨주면 됩니다. %matplot..

Python/Data science 2020.11.12