Những điều bạn cần biết về phân tích nhân tố khám phá trong SPSS

5 (100%) 6 votes

Trong một bài luận văn, hay bài nghiên cứu khoa học, phân tích nhân tố khám phá EFA là một bước rất quan trọng khi thực hiện phân tích dữ liệu định lượng bằng SPSS. Khi kiểm định một lý thuyết khoa học, chúng ta cần đánh giá độ tin cậy của thang đo (phân tích Cronbach Alpha) và giá trị của thang đo (EFA). Ở phần trước, chúng ta đã tìm hiểu về độ tin cậy thang đo, vấn đề tiếp theo là thang đo phải được đánh giá giá trị của nó.

Hai giá trị quan trọng được xem xét trong phần này là giá trị phân biệt và giá trị hội tụ. Hiểu một cách đơn giản:

– Đảm bảo “Giá trị phân biệt”: Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác.

– Thỏa mãn “Giá trị hội tụ”: Các biến quan sát hội tụ về cùng một nhân tố.

>>>Xem thêm bài viết liên quan: 

Hướng Dẫn Phân Tích hồi quy nhị phân Binary Logistic trong SPSS

Những điều bạn cần biết về chạy hồi quy SPSS

Những điều bạn cần biết về phân tích nhân tố khám phá trong SPSS

1. Phân tích nhân tố khám phá EFA LÀ GÌ?

– Phân tích nhân tố khám phá(EFA) là một phương pháp phân tích định lượng dùng để rút gọn một tập gồm nhiều biến đo lường phụ thuộc lẫn nhau thành một tập biến ít hơn (gọi là các nhân tố) để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu(Hair et al. 2009)

Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn. Trong nghiên cứu, chúng ta thường thu thập được một số lượng biến khá lớn và rất nhiều các biến quan sát trong đó có liên hệ tương quan với nhau. Thay vì đi nghiên cứu 20 đặc điểm nhỏ của một đối tượng, chúng ta có thể chỉ nghiên cứu 4 đặc điểm lớn, trong mỗi đặc điểm lớn này gồm 5 đặc điểm nhỏ có sự tương quan với nhau. Điều này giúp tiết kiệm thời gian và kinh phí nhiều hơn cho người nghiên cứu.

– Với kiểm định độ tin cậy thang đo Cronbach Alpha, chúng ta đang đánh giá mối quan hệ giữa các biến trong cùng một nhóm, cùng một nhân tố, chứ không xem xét mối quan hệ giữa tất cả các biến quan sát ở các nhân tố khác. Trong khi đó, EFA xem xét mối quan hệ giữa các biến ở tất cả các nhóm (các nhân tố) khác nhau nhằm phát hiện ra những biến quan sát tải lên nhiều nhân tố hoặc các biến quan sát bị phân sai nhân tố từ ban đầu.

2. Các tiêu chí quan trọng trong phân tích EFA

Kiểm định Bartlett (Bartlett’s test of sphericity) dùng để xem xét các biến quan sát trong nhân tố có tương quan với nhau hay không. Chúng ta cần lưu ý, điều kiện cần để áp dụng phân tích nhân tố là các biến quan sát phản ánh những khía cạnh khác nhau của cùng một nhân tố phải có mối tương quan với nhau. Điểm này liên quan đến giá trị hội tụ trong phân tích EFA được nhắc ở trên. Do đó, nếu kiểm định cho thấy không có ý nghĩa thống kê thì không nên áp dụng phân tích nhân tố cho các biến đang xem xét. Kiểm định Bartlett có ý nghĩa thống kê (sig Bartlett’s Test < 0.05), chứng tỏ các biến quan sát có tương quan với nhau trong nhân tố.

Hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số của KMO phải đạt giá trị 0.5 trở lên (0.5 ≤ KMO ≤ 1) là điều kiện đủ để phân tích nhân tố là phù hợp. Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu.

Trị số Eigenvalue là một tiêu chí sử dụng phổ biến để xác định số lượng nhân tố  trong phân tích EFA. Với tiêu chí này, chỉ có những nhân tố nào có Eigenvalue ≥ 1 mới được giữ lại trong mô hình phân tích .

Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại.

Tổng phương sai trích (Total Variance Explained) ≥ 50% cho thấy mô hình EFA là phù hợp. Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.

3. Các bước phân tích nhân tố khám phá EFA trong SPSS

Để thực hiện phân tích nhân tố khám phá EFA trong SPSS 20, chúng ta vào Analyze > Dimension Reduction > Factor

Bước 1 phân tích nhân tố khám phá EFA trong SPSS

Đưa các biến quan sát cần thực hiện phân tích EFA vào mục Variables.

Descriptives: Tích vào mục KMO and Barlett’s test of sphericity để xuất bảng giá trị KMO và giá trị sig của kiểm định Barlett. Nhấp Continue để quay lại cửa sổ ban đầu.

Bước 2 phân tích nhân tố khám phá EFA trong SPSS

– Extraction: Ở đây, chúng ta sẽ sử dụng phép trích PCA (Principal Components Analysis). Với SPSS 20 và các phiên bản 21, 22, 23, 24, PCA sẽ được viết gọn lại là Principal Components như hình ảnh bên dưới, đây cũng là tùy chọn mặc định của SPSS.

Bước 3 phân tích nhân tố khám phá EFA trong SPSS

Khi các bạn nhấp chuột vào nút mũi tên hướng xuống sẽ có nhiều tùy chọn phép trích khác nhau. Số lượng nhân tố được trích ra ở ma trận xoay phụ thuộc khá nhiều vào việc lựa chọn phép trích, tuy nhiên, tài liệu này sẽ chỉ tập trung vào phần PCA.

– Rotation: Ở đây có các phép quay, thường chúng ta hay sử dụng Varimax và Promax. Riêng với dạng đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta sử dụng phép quay Varimax. Nhấp Continue để quay lại cửa sổ ban đầu.

Bước 4 phân tích nhân tố khám phá EFA

 

Chọn “Scores…”, sau đó ta chọn các thông số như bên dưới:

Bước 5 phân tích nhân tố khám phá EFA

– Options: Tích vào 2 mục như hình bên dưới. Sorted by size giúp sắp xếp ma trận xoay thành từng cột dạng bậc thang để dễ đọc dữ liệu hơn. Suppress small coefficients giúp loại bỏ các hệ số tải không đạt tiêu chuẩn khỏi ma trận xoay, giúp ma trận gọn gàng, trực quan hơn. Tại mục này sẽ có hàng Absolute value below, bạn cần nhập vào giá trị hệ số tải nhân tố Factor Loading tối thiểu, thường là 0.3 và 0.5. Kích thước mẫu file dữ liệu là 220 nên tác giả sẽ nhập vào 0.5. Nhấp Continue để quay lại cửa sổ ban đầu.

Bước 6 phân tích nhân tố khám phá EFA

Ghi chú:

Chọn “Sorted by size” nếu chúng ta muốn sắp xếp các biến quan sát trong cùng một nhân tố đứng gần nhau.

Chọn “Suppress absolute value less than”, nếu chúng ta nhập giá trị 0.470, khi đó các trọng số nhân tố hay hệ số tải nhân tố (factor loading) có giá trị tuyệt đối nhỏ hơn 0.470 sẽ không được hiển thị trên bảng kết xuất Rotated Component Matrix.

Tại cửa sổ tiếp theo, bạn chọn OK để xuất kết quả ra Output.

Có khá nhiều bảng ở Output, tuy nhiên, chúng ta chỉ cần quan tâm 3 bảng:

– KMO and Barlett’s Test: Xem hệ số KMO và sig kiểm định Bartlett.

– Total Variance Explained: Xem tổng phương sai trích Total Variance Explained và giá trị Eigenvalue.

– Rotated Component Matrix: Xem ma trận xoay và kiểm tra hệ số tải Factor Loading của các biến quan sát.

4. Hướng dẫn tạo nhân tố, biến đại diện trong SPSS

Sau khi thực hiện xong phân tích nhân tố khám phá. Để tiến hành phân tích tương quan Peason và xa hơn nữa là hồi quy, bạn cần tạo các biến đại diện từ kết quả xoay nhân tố cuối cùng.

Bước thực hiện phân tích nhân tố khám phá, khi kết quả phân tích cuối cùng chấm dứt. Các biến quan sát được sắp xếp theo các nhóm nhân tố mới theo 2 tiêu chí: hội tụ và phân biệt. Dưới đây là một ví dụ về ma trận xoay nhân tố hoàn chỉnh:

Ma trận xoay nhân tố

Kết quả xoay nhân tố lần cuối chúng ta có được 6 nhân tố mới. Mỗi nhân tố sẽ gồm các biến đại diện nằm chung trên 1 cột. Để tiến hành đánh giá tương quan Pearson và hồi quy, chúng ta sẽ phải tạo các biến đại diện trung bình thông qua lệnh Mean trong Compute Variable.

Ở đây, ta sẽ tạo lần lượt các biến đại diện là:

X1 = Mean (TN3, TN2, TN1, TN5, TN4)

X2 = Mean (LD2, LD5, LD4, LD3)

…..

X6 = Mean (DN3, DN4, DN2)

Thực hiện trên SPSS, các bạn vào thẻ Transform > Compute Variable:

Tạo nhân tố đại diện

Giao diện cửa sổ mới hiện ra như hình dưới. Ở ô Target Variable, các bạn sẽ gõ tên biến đại diện mới (X1, X2, X3….). Mục Type & Label để các bạn điền vào chú thích cho biến, vai trò của nó giống như Lable khi các bạn tạo biến trong cửa sổ giao diện Variable View. Ví dụ biến X1 là đại diện cho nhóm biến quan sát: TN3, TN2….TN4, bạn chú thích biến này là biến Thu nhập thì sẽ gõ vào mục Type & Label.

Ở ô Numeric Expression các bạn gõ vào cấu trúc hàm: MEAN(TN3,TN2,TN1,TN5,TN4). Nghĩa là tạo biến đại diện X1 là trung bình của các biến quan sát TN3, TN2, TN1, TN5, TN4.

Biến đại diện

Sau khi tạo xong, các bạn vào lại giao diện Data View các bạn sẽ thây được các biến đại diện vừa mới được tạo ra bên cạnh các biến quan sát ban đầu:

Tạo biến đại diện

Như vậy là chúng ta đã tạo xong các biến đại diện sau khi phân tích EFA để sử dụng các biến này vào phân tích tương quan Pearson và hồi quy về sau.

5. Quy tắc loại biến xấu trong phân tích nhân tố khám phá EFA

Trước khi đi vào quy tắc loại biến xấu trong EFA. Các bạn cần nắm rõ điều kiện cần để bảng kết quả ma trận xoay có ý nghĩa thống kê là:

– Kiểm định Barlett có sig phải nhỏ hơn 0.05

– Hệ số KMO phải nằm trong đoạn từ 0.5 đến 1

– Tổng phương sai trích lớn hơn hoặc bằng 50%.

– Giá trị Eigenvalue lớn hơn hoặc bằng 1

Nếu một trong các tiêu chí trên bị vi phạm, bảng ma trận xoay sẽ không có ý nghĩa. Chính vì vậy, trước khi đến với việc chọn biến nào, loại biến nào các bạn cần kiểm tra xem các tiêu chí ở trên đã thỏa mãn chưa. Mọi thứ OK hết mới đi đến phần loại biến ở ma trận xoay.

Để quyết định giữ biến hay loại biến trong phân tích nhân tố khám phá EFA (Exploratory Factor Analysis), dữ liệu cần thỏa mãn 2 điều kiện:

– Đảm bảo “Giá trị phân biệt”: Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác.

– Thỏa mãn “Giá trị hội tụ”: Các biến quan sát hội tụ về cùng một nhân tố.

Nếu bạn gặp khó khăn khi thực hiện phân tích EFA vì số liệu khảo sát xấu dẫn đến bảng ma trận xoay lung tung, biến bị loại rất nhiều, bạn có thể tham khảo Dịch Vụ Xử Lý Số Liệu SPSS. Với dịch vụ này của Tri Thức Cộng Đồng, chúng tôi sẽ giúp bạn nâng hệ số KMO, đảm bảo ma trận xoay hội tụ như mong muốn, không bị loại quá nhiều biến, khắc phục lỗi không xuất hiện bảng KMO, bị tách nhân tố, biến nhảy lung tung.

Bình luận

avatar
2 Comment threads
0 Thread replies
Most reacted comment
Hottest comment thread
2 Comment authors
Thảo VânThảo Uyên Recent comment authors
  Subscribe  
Tin mới nhất Tin cũ nhất Bình chọn nhiều nhất
Notify of
Thảo Uyên
Guest
Thảo Uyên

chào ad, em sắp bảo vệ đề tài tốt nghiệp về spss, nhưng bây giờ em vẫn chưa thực sự hiểu về Phần trăm phương sai toàn bộ. Theo định nghĩa là coi biến thiên là 100% thì giá trị này cho biết phân tích nhân tố giải thích được bao nhiêu phần trăm.
Em muốn hỏi, biến thiên của dữ liệu này là biến thiên gì ạ? và giải thích ở đây là giải thích cái gì ạ ?

Thảo Vân
Guest
Thảo Vân

là 1 yếu tố ở phần phân tích nhân tố khám phá EFA ạ, mình hỏi ké ở đây thôi, rất mong ad giải đáp

Hotline: 0946 88 33 50
Chat Zalo
Zalo: 0946.883.350
Chat với chúng tôi qua Zalo