Quay lại blog sau một thời gian. Tôi xin mạn phép lấy bài GS Tuấn viết lại thành bài hướng dẫn
Phần mềm R-studio: http://www.rstudio.com/
1. Để kiểm định phân bố chuẩn
Có nhiều test. Ở đây lấy 1 cách.
Câu lệnh:
shapiro.test(biến định lượng)
Nếu p<0 class="GINGER_SOFTWARE_mark" ginger_software_uiphraseguid="b6b80ba2-e130-41f0-b65b-e49295cd3d21" id="461a8f0a-6e39-4590-bc12-820489a4fad4" span="">.0>
05:="" data-blogger-escaped-chu="" data-blogger-escaped-i="" data-blogger-escaped-kh="" data-blogger-escaped-n="" data-blogger-escaped-ng="" data-blogger-escaped-p="" data-blogger-escaped-ph="">Nếu p>0.05: PPC
Giả định trong bài này là Không phân phối chuẩn
Sử dụng file dữ liệu: https://www.dropbox.com/s/pv6rgs8c3u50n7z/R_finaldata.csv
Đọc dữ liệu: (tùy theo nguồn để file dữ liệu mà các bạn có thể viết câu lệnh dưới)
> setwd ("C:/Users/Administrator.ThinPC-PC/Dropbox/ICCCHR 2013/Publication/ACEs/Data_Analysis")
&g t; ACEsIQ = read.csv("R_finaldata.csv", header=TRUE)
&g t; attach(ACEsIQ)
& gt; names(ACEsIQ)
Câu lệnh để kiểm tra phân phối chuẩn (biến "ANscore" là biến số lo âu vaf biến định lượng liên tục
Lệnh
>s hapiro. test (ANscore)
Kết quả
Shapiro-Wilk normality test
data: ANscore
W = 0.9713, p-value = 3.336e-05
Phiên giải: với p<0 .05="">>> phân phối không chuẩn.0>
2. Kiểm định tổng xếp hạng Kruskal-Wallis
Giả thuyết: Tôi muốn xem sự khác biệt giữa các nhóm về trãi nghiệm bất lợi thời thơ ấu (ACesIQscore) với điểm số lo âu?
- Đầu vào: ACesIQscore: có 5 nhóm: 0; 1; 2;3 ;4 hoặc nhiều
- Đầu ra: ANscore: Biến định lượng
Xem xét trên tổng thể thì khi PP không chuẩn sẽ vi phạm kiểm định ANOVA.
Vậy nên sẽ sử dụng Kruskal-Wallis.
Câu lệnh
> kruskal.test(ANscore~ACesIQscore)
Kết quả:
Kruskal-Wallis rank sum test
data: ANscore by ACesIQscore
Kruskal-Wallis chi-squared = 25.4305, df = 4, p-value = 4.121e-05
Phiên giải
Có sự khác biệt giữa các nhóm.
Tuy nhiên có một câu hỏi đặt ra: Nhóm nào khác nhóm nào?
Xem lại kiểm định ANOVA, chúng ta thấy có kiểm định hậu định. Vậy trong trường hợp này chúng ta cũng cần làm tương tự.
Các bước làm
- Đầu tiên chạy packages
>install. pa(pckagirmess
lgesi"") > brary("pgirmess", lib.loc="c:/Program Files/R/R-2.15.0/library")
TRUE: khi giá trị quan sát > giá trị tham chiếu: Tức p<0 .05="" class="GINGER_SOFTWARE_mark" data-b="" ginger_software_uiphraseguid="be1238a2-8785-42ef-8abf-e8f63b41f497" id="9ea886bc-27cf-416e-ac92-adbe0bd67b53" span="">log0>ger-escaped-p="">FALSE: khi giá trị quan sát < giá trị tham chiếu: Tức p>0.05
Kết luận: Chỉ có sự khác biệt giữa 2 nhóm 1 và nhóm 4 với p<0 .05.="" p="">
Bài viết dựa vào bài giảng của GS Nguyển Văn Tuần theo đường link sau: http://www.youtube.com/watch?v=DnhCOOsFvQQ&feature=c4-overview&list=UU21dOPe-YHO3Gw6BRbyeotQ
0>
Phần mềm R-studio: http://www.rstudio.com/
1. Để kiểm định phân bố chuẩn
Có nhiều test. Ở đây lấy 1 cách.
Câu lệnh:
shapiro.test(biến định lượng)
Nếu p<0 class="GINGER_SOFTWARE_mark" ginger_software_uiphraseguid="b6b80ba2-e130-41f0-b65b-e49295cd3d21" id="461a8f0a-6e39-4590-bc12-820489a4fad4" span="">.0>
05:="" data-blogger-escaped-chu="" data-blogger-escaped-i="" data-blogger-escaped-kh="" data-blogger-escaped-n="" data-blogger-escaped-ng="" data-blogger-escaped-p="" data-blogger-escaped-ph="">Nếu p>0.05: PPC
Giả định trong bài này là Không phân phối chuẩn
Sử dụng file dữ liệu: https://www.dropbox.com/s/pv6rgs8c3u50n7z/R_finaldata.csv
Đọc dữ liệu: (tùy theo nguồn để file dữ liệu mà các bạn có thể viết câu lệnh dưới)
> setwd ("C:/Users/Administrator.ThinPC-PC/Dropbox/ICCCHR 2013/Publication/ACEs/Data_Analysis")
&g t; ACEsIQ = read.csv("R_finaldata.csv", header=TRUE)
&g t; attach(ACEsIQ)
& gt; names(ACEsIQ)
Câu lệnh để kiểm tra phân phối chuẩn (biến "ANscore" là biến số lo âu vaf biến định lượng liên tục
Lệnh
>s hapiro. test (ANscore)
Kết quả
Shapiro-Wilk normality test
data: ANscore
W = 0.9713, p-value = 3.336e-05
Phiên giải: với p<0 .05="">>> phân phối không chuẩn.0>
2. Kiểm định tổng xếp hạng Kruskal-Wallis
Giả thuyết: Tôi muốn xem sự khác biệt giữa các nhóm về trãi nghiệm bất lợi thời thơ ấu (ACesIQscore) với điểm số lo âu?
- Đầu vào: ACesIQscore: có 5 nhóm: 0; 1; 2;3 ;4 hoặc nhiều
- Đầu ra: ANscore: Biến định lượng
Xem xét trên tổng thể thì khi PP không chuẩn sẽ vi phạm kiểm định ANOVA.
Vậy nên sẽ sử dụng Kruskal-Wallis.
Câu lệnh
> kruskal.test(ANscore~ACesIQscore)
Kết quả:
Kruskal-Wallis rank sum test
data: ANscore by ACesIQscore
Kruskal-Wallis chi-squared = 25.4305, df = 4, p-value = 4.121e-05
Phiên giải
Có sự khác biệt giữa các nhóm.
Tuy nhiên có một câu hỏi đặt ra: Nhóm nào khác nhóm nào?
Xem lại kiểm định ANOVA, chúng ta thấy có kiểm định hậu định. Vậy trong trường hợp này chúng ta cũng cần làm tương tự.
Các bước làm
- Đầu tiên chạy packages
>install. pa(pckagirmess
lgesi"") > brary("pgirmess", lib.loc="c:/Program Files/R/R-2.15.0/library")
Tiếp theo, chúng ta sử dụng câu lệnh
> kruskalmc(CESD, ACesIQscore)
Và đây là kết quả:
Multiple comparison test after Kruskal-Wal
lis
p.val
ue: 0.0
5
C
omparisons
obs.dif critical.dif difference
0-1 3.167551 37.58272 FALSE
0-2 6.381626 38.87619 FALSE
0-3 25.429885 48.74687 FALSE
0-4 42.117140 46.81882 FALSE
1-2 9.549177 36.10600 FALSE
1-3 28.597436 46.56761 FALSE
1-4 45.284691 44.54534 TRUE
2-3 19.048259 47.61764 FALSE
2-4 35.735514 45.64192 FALSE
3-4 16.687255 54.29626 FALSE
TRUE: khi giá trị quan sát > giá trị tham chiếu: Tức p<0 .05="" class="GINGER_SOFTWARE_mark" data-b="" ginger_software_uiphraseguid="be1238a2-8785-42ef-8abf-e8f63b41f497" id="9ea886bc-27cf-416e-ac92-adbe0bd67b53" span="">log0>ger-escaped-p="">FALSE: khi giá trị quan sát < giá trị tham chiếu: Tức p>0.05
Kết luận: Chỉ có sự khác biệt giữa 2 nhóm 1 và nhóm 4 với p<0 .05.="" p="">
Bài viết dựa vào bài giảng của GS Nguyển Văn Tuần theo đường link sau: http://www.youtube.com/watch?v=DnhCOOsFvQQ&feature=c4-overview&list=UU21dOPe-YHO3Gw6BRbyeotQ
0>
Nhận xét