Tổng quan kiến thức cơ bản về kiểm định white trong thống kê
Trong kiểm định thống kê, đối với các mẫu thử lớn, các nhà nghiên cứu sẽ ưu tiên sử dụng kiểm định White. Kiểm định White trong spss được chia thành 2 loại có tích chéo và không có tích chéo. Vậy mỗi loại kiểm định này có gì khác nhau? Cùng Tri Thức Cộng Đồng tìm hiểu những kiến thức tổng quan về phương thức kiểm định này trong bài viết dưới đây.
Mục lục
1. Khái niệm về kiểm định white
Khái niệm về kiểm định white
Kiểm định White là một phương pháp kiểm định thống kê để kiểm tra xem các phương sai trong mẫu có thay đổi hay không. Đây là phương pháp kiểm định do eview thực hiện dựa trên hồi quy phần dư theo bậc nhất và bậc hai của các biển độc lập.
Bạn có thể sử dụng kiểm định White trong trường hợp yêu cầu biến độc lập có tương tác hoặc tác động phi tuyến tính lên phương sai. Tuy nhiên, một ưu điểm của kiểm định White là phương pháp này có thể đưa về một kết quả có nghĩa dù các lỗi của phương sai là bằng nhau dù White không cho chúng ta biết lỗi đó là gì.
2. Lý giải 2 loại kiểm định white
Kiểm định White trong spss được chia thành 2 loại, bao gồm kiểm định không có tích chéo và kiểm định có tích chéo. Mỗi loại kiểm định được sử dụng trong những trường hợp khác nhau. Cùng chúng tôi tìm hiểu về các hai loại kiểm định này dưới đây.
2.1. Kiểm định không có tích chéo
Kiểm định White không có tích chéo được sử dụng để kết luận về phương sai sai số của mô hình gốc dựa vào các số liệu thống kê và giá trị p. Khi sử dụng phương pháp tính thủ công, người ta sẽ ưu tiên loại bỏ các tích chéo khỏi các mô hình hồi quy phụ để việc kiểm định White đơn giản hơn.
Yi= 1 + 2X2 + ¢ 3X3 + Ui (1.1)
- Đầu tiên, ta sử dụng mô hình hồi quy OLS để ước lượng công thức (1.1), từ đó thu được các phần dư tương ứng với ei.
- Tiếp theo, ta ước lượng công thức:
ei²= α1+ α2X2+ α3X3+ α4X2² + α5X3² + Vi (1.2) và thu được hệ số xác định bội là R².
- Sau đó, chúng ta tiến hành kiểm định các giả thuyết đưa ra với các hệ số, mỗi hệ số là một kết quả khác nhau:
- Trường hợp H0 có α2= α3= α4= α5=0, khi đó H0 là phương sai sai số đồng đều.
- Trường hợp H0 có tồn tại ít nhất αj # 0 thì phương sai sai số thay đổi.
- Từ các trường hợp trên, chúng ta tiến hành tra cứu trong bảng phân phối chi bình phương, mức ý nghĩa của α và có bậc tự do là tham số trong mô hình hồi quy phụ k.
- Cuối cùng, phương pháp kiểm định không có tích chéo cho ra các kết quả theo các trường hợp sau:
- Nếu Fps = ( R ²/(1- R ²))/ ((n-k)/(k-1)) thì so sánh với F α (k-1,n-k).
- Nếu χ²ps = nR ² thì so sánh với χ² α (k-1).
- Nếu cho χ²ps > χ² α (k-1) thì phủ nhận và loại bỏ H0.
- Nếu χ²ps < χ² α (k-1) thì chấp nhận H0.
Chú ý:
- Tiêu chuẩn để tiến hành kiểm định White không có tích chéo trong trường hợp này là χ² =χ(k-1).
- Các ước lượng hệ số của công thức (1.1) là ước lượng lớn nhất, nếu không bạn sẽ phải ước lượng một hệ số lớn hơn.
- X²tc = X²(k,α) - Nghĩa là giá trị bình phương tiêu chuẩn phải lấy theo số biến k bằng số biến trong mô hình hồi quy ban đầu. Thông thường, số biến này sẽ bằng hai lần số biến độc lập trong mô hình hồi quy gốc.
- Nếu bạn muốn loại bỏ các số hạng bậc nhất ở biến độc lập, bạn cần chú ý đến số bậc tự do khi tra cứu và đối chiếu lại bảng.
2.2. Kiểm định có tích chéo
Kiểm định White có tích chéo được sử dụng nếu bạn muốn có đầy đủ có biến tích trong hàm hồi quy phụ. Việc sử dụng kiểm định có tích chéo cũng được đánh giá là đơn giản hơn so với kiểm định không có tích chéo.
Đối với kiểm định White có tích chéo, ta xét mô hình hồi quy của 3 biến sau:
Yi = 1 + 2X2 + 3X3
- Đầu tiên, ta tiến hành ước lượng mô hình trên để thu về các phần dư ei.
- Sau đó thực hiện ước lượng mô hình hồi quy phụ dạng dưới đây để tìm hệ số xác định bội R²:
ei²= α1+ α2X2+ α3X3+ α4X2² + α5X3² +α6X2X3 + Vi
- Tiếp đó, chúng ta có thể kiểm định các giả thuyết theo các trường hợp của H:
- Nếu H0: α1= α2= α3= α4= α5 = α6=0 thì phương sai H0 sai số không thay đổi.
- H1 có tồn tại ít nhất αj # 0 thì phương sai H1 có sai số thay đổi.
- Cuối cùng, để kết luận, bạn cần phải tra cứu và đối chiếu trong bảng phân phối Chi bình phương, mức ý nghĩa của α và bậc tự đo tham số trong mô hình hồi quy phụ k.Trường hợp nR² > X²α(k-1) thì phủ nhận và loại bỏ H0 và ngược lại thì chấp nhận H0.
- Chú ý:
- Tiêu chuẩn để thực hiện kiểm định White có tích chéo là χ² =χ(df) và bạn phải tính được trị thống kê nR2. Trong đó, n là cỡ mẫu, R là hệ số xác định của mô hình hồi quy phụ ước ở bước ước lượng phụ.
- Mô hình ước lượng hồi quy phụ phải có hệ số chẵn.
- nR2 và R2 của mô hình hồi quy phụ cần được thống kê rõ ràng.
- Vì GT có tương đương với H0:R 2=0 nên còn được KĐ theo phương thức thống kê f.
3. Hướng dẫn chi tiết tiến hành kiểm định white
Để hiểu rõ hơn về cách kiểm định White trong spss, cùng Tri Thức Cộng Đồng tìm hiểu bài toán dưới đây:
Cho bảng số liệu sau:
Năm |
X |
Y |
Z |
1990 |
20666.5 |
19225.1 |
6042.8 |
1991 |
41892.6 |
19621.9 |
6302.8 |
1992 |
49061.1 |
21590.4 |
6475.3 |
1993 |
53929.2 |
22836.5 |
6559.4 |
1994 |
64876.8 |
23528.2 |
6598.6 |
1995 |
85507.6 |
24963.7 |
6765.6 |
1996 |
92406.2 |
26396.7 |
7003.8 |
1997 |
99352.3 |
27523.9 |
7099.7 |
1998 |
114417.7 |
29145.5 |
7362.7 |
1999 |
128416.2 |
31393.8 |
7653.6 |
2000 |
129140.5 |
32529.5 |
7666.3 |
2001 |
130177.6 |
32108.4 |
7492.7 |
2002 |
145021.3 |
34447.2 |
7504.3 |
2003 |
15395.5 |
34568.8 |
7452.2 |
2004 |
172494.9 |
36148.9 |
74453 |
32005 |
183342.4 |
35832.9 |
7329.2 |
2006 |
197855 |
35849.5 |
7324.8 |
2007 |
236935 |
35942.7 |
7207.4 |
2008 |
377238.6 |
38729.8 |
7400.2 |
2009 |
410138 |
38895.5 |
7440.1 |
Trong đó:
X: Sản lượng lúa từng năm ( nghìn tấn)
Y: Giá trị sản xuất nông nghiệp theo giá trị thực tế (tỷ đồng)
Z: Diện tích lúa từng năm ( nghìn ha)
Đề bài: Với mức ý nghĩa α = 5%, hãy trình bày hiện tượng phương sai sai số thay đổi và khắc phục hiện tượng này.
Bài làm
Từ các số liệu trên, ta ước lượng được mô hình:
Y^= 4207489 + 22.25769*X - 133.0589*Z (*)
3.1. Thực hiện kiểm định white có tích chéo
- Ước lượng mô hình từ mô hình trên và các phần dư ei:
ei ²= α1+ α2X2+ α3X3+ α4X2² + α5X3² +α6X2X3 + Vi
từ đó ta thu được:
White Heteroskedasticity Test:
F-statistic |
9.715203 15.52544 |
Probability Probability |
0.000360 0.008338 |
|
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/12/2022 Time: 15:16 Sample: 1990 2009 Included observation: 20 |
||||
Variable |
Coefficient |
Std.Error |
T-statistic |
Pron. |
C |
-2.26E+11 |
2.20E+11 |
-1.029639 |
0.3206 |
X |
-6417255. |
7006442. |
-0.915908 |
0.3752 |
X^2 |
121.0666 |
55.64401 |
2.175734 |
0.0472 |
X*Z |
-130.4743 |
1325.051 |
-0.098467 |
0.9230 |
Z |
84258307 |
87178178 |
0.966507 |
0.3502 |
Z^2 |
-5201.948 |
8535.558 |
-0.609444 |
0.5520 |
R-squared |
0.776272 |
Mean dependent var |
1.82E+09 |
|
Adjusted R-squared |
0.696369 |
S.D. dependent var |
3.09E+09 |
|
S.E. of regression |
1.70E+09 |
Akaike info criterion |
45.59380 |
|
Sum squared resid |
4.07E+19 |
Schwarz criterion |
45.89252 |
|
Log likelihood |
-449.9380 |
F-statistic |
9.715203 |
|
Durbin-Watson stat |
1.504247 |
Prob(F-statistic) |
0.000360 |
Vậy:
ei² = -2.26E+11 – 6417255*X2 + 84258307*Z3 + 121.0666*X2² - 5201.948*X3² -130.4743*X2X3
- Kiểm định giả thuyết:
- H0:α2= α3= α4= α5=0
- H1:Tồn tại ít nhất αj # 0
- Tiêu chuẩn kiểm định: χ² =χ²(k-1)
χ²(k-1) = χ²(6-1) = χ²(5) = 11.0705
n*R² = 20*0.776272 = 15.52544
- Tra bảng phân phối Chi-bình phương , mức ý nghĩa α và bậc tự do là k (k là số tham số trong mô hình hình hồi quy phụ): Do n*R² > χ²(5), nên loại bỏ H0 và chấp nhận H1.
- Kết luận kiểm định: Có hiện tượng phương sai sai số thay đổi
3.2. Thực hiện kiểm định white không có tích chéo
- Ước lượng mô hình đã cho bằng OLS :
ei ²= α1+ α2X2+ α3X3+ α4X2² + α5X3² + Vi
từ đó thu được:
White Heteroskedasticity Test:
F-statistic |
12.99983 15.52234 |
Probability Probability |
0.000091 0.003732 |
|
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/12/2022 Time: 14:16 Sample: 1990 2009 Included observation: 20 |
||||
Variable |
Coefficient |
Std.Error |
T-statistic |
Pron. |
C |
-2.43E+11 |
1.33E+1 |
-1.830895 |
0.0871 |
X |
-7075360. |
2032090. |
-3.481814 |
0.0033 |
X^2 |
116.5557 |
30.52434 |
3.818450 |
0.0017 |
Z |
91675414 |
42413882 |
2.161448 |
0.0472 |
Z^2 |
-5990.669 |
2849.886 |
-2.102073 |
0.0528 |
R-squared |
0.77611 |
Mean dependent var |
1.82E+09 |
|
Adjusted R-squared |
0.716415 |
S.D. dependent var |
3.09E+09 |
|
S.E. of regression |
1.65E+09 |
Akaike info criterion |
45.49449 |
|
Sum squared resid |
4.07E+19 |
Schwarz criterion |
45.74343 |
|
Log likelihood |
449.9449 |
F-statistic |
12.99983 |
|
Durbin-Watson stat |
1.502099 |
Prob(F-statistic) |
0.000091 |
Vậy:
ei ²=( -2.43E+11) -7075360X+91675414Z+ 116.5557X² -5990.669Z²
- Kiểm định giả thuyết:
- H0: α2= α3= α4= α5=0
- H1: Tồn tại ít nhất αj # 0
- Tiêu chuẩn kiểm định: χ² =χ²(k-1)
χ²(k-1) = χ²(5-1) = χ²(4) = 9.48773
n*R² = 20*0.776117= 15.52234
- Tra bảng phân phối Chi-bình phương , mức ý nghĩa α và bậc tự do là k (k là số tham số trong mô hình hình hồi quy phụ): n*R²>χ²(4), nên loại bỏ H0, chấp nhận H1.
- Kết luận kiểm định: Có hiện tượng phương sai sai số thay đổi.
Trên đây là tổng hợp những kiến thức tổng quan về kiểm định White trong spss. Hy vọng với những nội dung cũng bài toán ví dụ trên, bạn đọc đã có được một cái nhìn toàn diện hơn về phương thức kiểm định này.
0 bình luận
Sắp xếp: Mới nhất