Recent posts

오차(Error)와 잔차(Residual)

오차 (Error) 모집단에서 회귀식을 얻었을 때 그 회귀식을 통해 얻은 예측값과 실제 관측값의 차이 잔차 (Residual) 표본집단에서 회귀식을 얻었을 때 그 회귀식을 통해 얻은 예측값과 실제 관측값의 차이 회귀식을 구할 때 대부분 표본집단에서 회귀식을 얻기 때문에 오차제곱...

[python] crc32로 해쉬 얻기

crc32 함수는 어떤 파일이나 id 에 대한 hash 값을 만들어 준다. 해당 데이터의 오류 확인이나 중복검사에 사용할 수 있다. 사용되는 곳 특정 파일이 원본과 다르거나 깨지지 않았는지 확인할 때 사용할 수 있다. 예를 들어 어떤 파일을 다운받았을 때, 파일의 제공자가 ...

[Numpy] eye 함수 와 identity 함수의 차이

Numpy 라이브러리의 eye 함수와 identity 함수는 둘다 단위 행열을 만들어주는 동일한 기능을 가진 함수다. 그런데 왜 두개로 나뉜걸까? 두 함수에 차이가 있는것은 아닐까? 함수 내부를 들여다 보자 identity 함수의 소스코드를 보면 바로 답이 나온다. if...

[python] Wikipedia API로 크롤러 모듈 제작하기

크롤러를 만들게 된 이유 게임 판매량을 가지고 분석을 진행하는 프로젝트 진행중 데이터에 출시년도 장르 퍼블리셔 등의 항목이 누락되어 있었다. 300개 정도의 항목이 빠져있었는데 일일이 검색해서 채워넣는건 무리라고 판단해 크롤러를 제작해 보기로 마음먹었다. 클래스 만들기 먼저 ...

위키피디아(wikipedia) 페이지 크롤링

위키피디아(wikipeida)에는 페이지를 손쉽게 크롤링 할수 있도록 api를 제공한다. 설치 사용전에 먼저 api를 설치해줘야 한다. IntEnum 을 사용하기 때문에 파이썬 3.4 버전 이상이 필요하다고 한다. 터미널에서 아래 코드로 api를 설치한다. pip insta...