02 Ago 2019

포아송회귀 예제

푸아송 회귀는 종속 변수가 카운트인 경우(예: 콜 센터에서 전화 통화가 도착하는 경우)에 적합할 수 있습니다. [1] 이벤트는 한 호출의 도착이 다른 호출의 가능성을 더 많거나 적게 만들지 않는다는 점에서 독립적이어야 하지만 이벤트의 단위 시간당 확률은 시간대와 같은 공변량과 관련이 있는 것으로 이해됩니다. 큰 수단의 경우, 정규 분포는 푸아송 분포에 대한 좋은 근사치이다. 따라서 푸아송 회귀는 응답 변수가 작은 정수인 경우에 더 적합합니다. 푸아송 회귀는 비례 위험 모델, 생존 분석의 한 클래스를 생성 : Cox 모델에 대한 설명에 대한 비례 위험 모델을 참조하십시오. 푸아송 분포는 주어진 시간 간격 내에서 발생하는 이벤트의 확률을 찾는 데 가장 일반적으로 사용됩니다. Poisson 분포를 사용하여 개수에 대해 이야기하기 때문에 결과가 0 이상이어야 하므로 이벤트가 음수로 발생하는 것은 불가능합니다. 반면에 정규 분포는 연속 변수에 대한 연속 분포이며 양수 또는 음수 값을 초래할 수 있습니다. 특정 상황에서관찰된 분산이 평균보다 크다는 것을 발견할 수 있습니다. 이를 과분산이라고 하며 모델이 적절하지 않음을 나타냅니다. 일반적인 이유는 관련 설명 변수 또는 종속 관측값의 누락입니다. 경우에 따라 과분분산 문제는 준우도 추정 또는 음수 이항 분포를 대신 사용하여 해결할 수 있습니다. [2] [3] 과다 분산을 처리하는 또 다른 방법은 푸아송 대신 음수 이항을 사용하여 응답을 모델링하는 것입니다.

이 방법의 장점은 모델에 더 많은 유연성을 제공하는 (lambda) 외에 다른 매개 변수를 도입하고, 준이음 모델과 반대로 음수 이항 모델은 명시적 우도 모델을 가정한다는 것입니다. 음수 이항 임의 변수는 모델링 개수와 일치하는 음수 정수 값을 사용할 수 있습니다.