밑바닥부터 시작하는 데이터 과학 5-7장
5장 통계 데이터를 어디부터 설명해주어야 하냐? 중심경향성(Central Tendency) : 평균, 중앙값산포도 : 데이타가 어느 범위에 걸처있는지. 분산, 표준편차, 공분산.심슨의 역설 : 혼재변수(Confounding variables)를 제거하지 않아서 잘못 계산됨.상관관계는 인과관계를 의미하지 않는다. 6장 확률 베이즈 정리 : 경우가 바뀌었을 때, 사건이 일어날 확률확률변수 : 사건이 일어났냐 안 일어났냐를 지칭하는 변수.정규분포 : 평균 = 0 / 표준편차 = 1중심극한정리 : 많이하면 정규분포를 따른다. 7장 가설과 추론 p-value : 측정값이 우연히 나올 확률 / p-value가 작을수록 기각하기 쉬우므로 실험자가 유리하다. 그러나 5%에 가까울 수록 실험이 애매하다. 5% 이상일 경..
자기개발/책 요약
2017. 10. 10. 22:22