Publié le

다중회귀분석 예제 r

다변량 다중 회귀는 단일 예측 변수 집합을 사용하여 여러 응답 또는 종속 변수를 모델링하는 방법입니다. 예를 들어, 성별, 인종, 부모 소득 등의 함수로 수학 및 읽기 SAT 점수를 모두 모델링할 수 있습니다. 이를 통해 각 점수와 성별의 관계를 평가할 수 있습니다. “각 종속 변수에 대해 별도의 회귀를 실행하는 것은 어떨까요?” 그건 실제로 좋은 생각! 그리고 사실 그것은 다변량 다중 회귀가 하는 일입니다. 예측 변수에 따라 각 종속 변수를 별도로 회귀합니다. 그러나 여러 응답이 있기 때문에 회귀 매개 변수에 대한 가설 테스트와 예측에 대한 신뢰 구간을 수정해야 합니다. R에는 강력한 회귀를 돕기 위한 많은 기능이 있습니다. 예를 들어 MASS 패키지의 rlm() 함수를 사용하면 강력한 회귀를 수행할 수 있습니다. 존 폭스 (다른 사람?) 강력한 회귀는 좋은 시작 개요를 제공합니다. UCLA 통계 컴퓨팅 웹 사이트에는 강력한 회귀 예제가 있습니다.

R에서 다중 선형 회귀를 수행하는 방법에 대한 전체 예제를 보려면 다중 선형 회귀 예제(.txt) 파일을 다운로드하십시오. 우리는 우리의 mlm1 개체와 R의 추출기 함수를 사용할 수 있습니다., 우리가 두 배 출력을 얻을 거 야 제외 하 고. 예를 들어, 한 세트의 잔차 대신 두 가지를 얻습니다: 두 개의 독립/입력 변수를 기반으로 가상 경제의 stock_index_price(종속 변수)를 예측하는 것이 목표인 간단한 예제로 시작하겠습니다. 두 모델의 계수입니다. 예측 변수가 두 모델에 공동으로 기여하는지 여부를 결정할 때 이러한 공분산을 고려해야 합니다. 예를 들어 PR 및 DIAP의 효과는 경계선을 보입니다. 그들은 TOT에 대 한 중요 한 표시 하지만 AMI에 대 한 덜 그렇게. 그러나 두 개의 별도 회귀에서 결과를 눈으로 볼 충분하지 않습니다! 우리는 공식적으로 그들의 포함에 대 한 테스트 해야. 그리고 이 테스트에는 두 모델의 계수 간의 공분산이 포함됩니다. 이러한 결과를 바탕으로 GEN 및 AMT만 있는 모델이 5개의 예측 변수를 모두 가진 모델과 적합한지 확인할 수 있습니다. 이 작업을 수행할 수 있는 한 가지 방법은 더 작은 모델에 맞게 다음 anova() 함수를 사용하여 더 작은 모델을 더 큰 모델과 비교하는 것입니다(작은 “a”를 주의하십시오.

이것은 자동차 패키지의 Anova() 기능과 다릅니다). 예를 들어 아래에서 GEN 및 AMT만 포함하는 update() 함수를 사용하여 새 모델을 만듭니다. “라는 표현입니다. ~ . – PR – DIAP – QRS는”말한다 “PR을 제외하고 동일한 응답과 예측 을 유지, DIAP 및 QRS.” 예를 들어, YouTube 및 신문 광고 예산의 고정된 금액의 경우 Facebook 광고에 1000달러를 추가로 지출하면 평균 약 0.1885*1000 = 189개의 판매 단위로 매출이 증가합니다. 이 예에서 YouTube 및 Facebook 예측 변수를 사용하면 조정된 R2 = 0.89로, “매출 측정값의 89%는 YouTube 및 Facebook 광고 예산에 의해 예측될 수 있습니다. 다중 선형 회귀 모델을 사용하여 예상 값을 계산하는 것 이상을 수행할 수 있습니다. 여기서 요약(OBJECT) 함수는 유용한 도구입니다. 선형 모델에 대한 풍부한 중요한 정보를 생성할 수 있습니다.