티스토리 뷰

5장 통계


데이터를 어디부터 설명해주어야 하냐?


중심경향성(Central Tendency) : 평균, 중앙값

산포도 : 데이타가 어느 범위에 걸처있는지. 분산, 표준편차, 공분산.

심슨의 역설 : 혼재변수(Confounding variables) 제거하지 않아서 잘못 계산됨.

상관관계는 인과관계를 의미하지 않는다.




6장 확률


베이즈 정리 : 경우가 바뀌었을 , 사건이 일어날 확률

확률변수 : 사건이 일어났냐 일어났냐를 지칭하는 변수.

정규분포 : 평균 = 0 / 표준편차 = 1

중심극한정리 : 많이하면 정규분포를 따른다.




7장 가설과 추론


p-value : 측정값이 우연히 나올 확률 / p-value 작을수록 기각하기 쉬우므로 실험자가 유리하다. 그러나 5% 가까울 수록 실험이 애매하다. 5% 이상일 경우에는 기각하지 않는다.

베이지안 추론 : 사전확률을 가지고 사후확률을 개선.

댓글
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31