Recent posts

왜 표본분산을 구할때 n-1로 나눌까?

구글에 이 질문을 검색하면 많은 포스트와 유튜브영상이 나온다. 하지만 나오는 것들은 복잡한 수식과 증명들 뿐이었다. 고등학생 때 진작 수학과 데면데면한 사이가 된 나로써는 증명이 이해가 안되었고 어찌저찌 증명을 이해해도 결국 “그래서 왜 n-1 인데?” 라는 질문에 해답을 얻진 ...

p-value가 0.05인 이유 - 심리 실험

왜 p-value는 0.05일까? 통계를 공부하면 p-value에 대해 배우고 이것을 보통 0.05로 사용한다고 배운다. p-value 가 0.05라는 말은 해당 통계 결과가 우연일 확률이 5%라는 것을 의미하고 이것은 결과가 통계적으로 유의미하다는 것으로 해석할 수 있다. 하...

정형 데이터의 종류

“데이터과학을 위한 통계” 책을 읽고 있다. 앞으로 거기에 나오는 개념들을 포스팅해보려 한다. 데이터의 종류를 구분하는 이유 데이터 분석, 예측 모델링 할 때, 데이터 종류에 따라 시각화, 해석, 통계 모델 결정 방법이 달라진다. 데이터를 다루는 프로그램에서 데이터 종류...

[matplotlib, python] figsize 조정이 안될 때

matplotlib에서 그래프의 사이즈를 키우려면 ‘figure’ 함수를 사용한다. 그런데 함수가 아래쪽에 있으면 동작하지 않는다. plt.hist(sample_of_10, alpha=.5); plt.hist(sample_of_100, alpha=.5); plt.axvline(...

[Numpy] Numpy.random.choice

파라미터 값에 따라 리스트에서 무작위로 데이터를 추출하는 메소드이다. Numpy.random.choice Parameters a : 1-D array-like or int 무작위 추출을 원하는 데이터. 만약 int 값을 넣을경우 0부터 해당 수까지의 정수배열을 생성한...