2018년 9월 19일 수요일

180919 Log odds, odds... logistic regression란 도대체 뭘 하는 걸까?

https://en.wikipedia.org/wiki/Odds

궁금

  1. 왜 odds라는 용어가 필요한 건가? odds가 뭔가?
  2. log odds를 쓰는 이유는 그냥 곱하기를 더하기로 만들기 위해서인지?
  3. logistic regression이 log odds를 쓰는 이유가 뭘까?

설명

  1. odds: A, B 팀이 경기를 할 때, A의 odds of winning은 아래 ratio로 나타난다.
  • 'A가 이기는 횟수' : 'B가 이기는 횟수'
  • odds는 확률이 아니다. 확률을 이용해 odds를 계산할 수 있다. = p / (1-p)
  1. odds가 대칭이면 직관적으로 분석하기 쉽다… (두 팀의 odds를 비교한다든지)
  • 예를 들어, 1/6과 6/1은 log(1/6) = -log(6/1) 이므로 두 odds가 역수 관계에 있다는 것을 간단히 알 수 있다.
  1. 어떤 event를 log odds의 히스토그램으로 나타내면… normal distribution 꼴이 된다.
  • true / false, yes / no 등의 task를 푸는데 통계적으로 적합하다.

댓글 없음:

댓글 쓰기