티스토리 뷰
5장 통계
데이터를 어디부터 설명해주어야 하냐?
중심경향성(Central Tendency) : 평균, 중앙값
산포도 : 데이타가 어느 범위에 걸처있는지. 분산, 표준편차, 공분산.
심슨의 역설 : 혼재변수(Confounding variables)를 제거하지 않아서 잘못 계산됨.
상관관계는 인과관계를 의미하지 않는다.
6장 확률
베이즈 정리 : 경우가 바뀌었을 때, 사건이 일어날 확률
확률변수 : 사건이 일어났냐 안 일어났냐를 지칭하는 변수.
정규분포 : 평균 = 0 / 표준편차 = 1
중심극한정리 : 많이하면 정규분포를 따른다.
7장 가설과 추론
p-value : 측정값이 우연히 나올 확률 / p-value가 작을수록 기각하기 쉬우므로 실험자가 유리하다. 그러나 5%에 가까울 수록 실험이 애매하다. 5% 이상일 경우에는 기각하지 않는다.
베이지안 추론 : 사전확률을 가지고 사후확률을 개선.
'자기개발 > 책 요약' 카테고리의 다른 글
밑바닥부터 시작하는 데이터 과학 17 - 19장 (0) | 2017.11.07 |
---|---|
밑바닥부터 시작하는 데이터 과학 11-13장 (0) | 2017.10.31 |
밑바닥부터 시작하는 데이터 과학 14-16장 (0) | 2017.10.24 |
밑바닥부터 시작하는 데이터 과학 8-10장 (0) | 2017.10.17 |
밑바닥부터 시작하는 데이터 과학 1-4, 25장 (0) | 2017.09.27 |
댓글