Chuyển đến nội dung chính

Visitors (statistics)

Hồi quy tuyến tính đơn giản



Hôm trước chúng ta lược qua một số ví dụ rất hay của ThầyDương. Hôm nay để đi vào cụ thể tôi sẽ H. File số liệu đính kèm
Khi làm nghiên cứu  cái cần lưu ý trong thiết kế đó là
Biến phụ thuộc là gì và phải phân biệt rõ biến độc lập và biến phụ thuộc
Ở đây, tôi lấy ví dụ về Tuổi liên quan đến giá trị creatinine
Outcome: cre
income: age
Nhưng trước đó, các bạn có thể cần chuyể biị số liệu mình sang STata đã: Dùng cái này  statransfer

Chúng ta xem như số liệu đã được làm sạch và được kiểm tra kĩ
Bước 1:
Trước tiên các bạn kiểm tra tính chuẩn của cre (lab3.dta)
-          Bộ số liệu sẵn sàng (đã được mở)
Kiểm tra tính chuẩn
Dòng lệnh: qnorm cre



H1: Kiểm tra phân phối chuẩn của biến cre
Kết luận: Không phân phối chuẩn
Các bạn có thể nhìn vào đây (h2) để xđ tính chuẩn hay không


Việc cần thiết đó là chúng ta cần đưa nó về dạng chuẩn (Có nhiều cách để tìm hiểu bằng cách nào để làm cho số liệu chuẩn)
Cách 1:
Bạn dung lệnh Transformation:  ladder cre
Transformation         formula               chi2(2)       P(chi2)
------------------------------------------------------------------
cubic                  creat^3                    .            .
square                 creat^2                    .            .
identity               creat                      .            .
square root            sqrt(creat)                .        0.000
log                    log(creat)                 .        0.000
1/(square root)        1/sqrt(creat)              .        0.000
inverse                1/creat                    .        0.000
1/square               1/(creat^2)                .            .
1/cubic                1/(creat^3)                .            .

Ở đây chúng ta sẽ tìm bảng Transformation: Cái nào có X2 nhỏ nhất với p<0 .05=".05" l="l" span="span" th="th" y.="y.">
Lấy ở đây là lấy phép tính nào để chuyển số liệu sang dạng chuẩn.
Tuy nhiên, các bạn nhìn thấy trên – Với Cre thì không ra được kết quả để có thể xác định được.

Chúng ta sang cách thứ 2, đó là chạy lệnh gladder cre

Xem kết quả nha(N
Nhớ để ý xem cái nào phân phối đẹp “Phân phối chuẩn”)

Qua biểu đồ trên chúng ta thấy biêu đồ 5 là chuẩn nhất đúng không?
Vậy nên chúng ta quyết định chuyển số liệu sang dạng Log.


Bước đầu tiên
Tạo biến mới: gen lncre = log(cre)
Chú ý: lncre chỉ là tên biến nên bạn có quyền thay đổi bằng tên khác.

Bấy giờ xem lại phân phối chuẩn nào bằng lệnh qnorm
Chúng ta thấy đẹp hơn đúng không :D

Kết luận 1: Chúng ta đã chuyển số liệu cre sang phân phối chuẩn

Bước 2:
Xem số liệu của biến tuổi. Chúng ta cần chuyển sang giá trị trung tâm (Nói chung tùy thuộc vào mục tiêu NC của chúng ta, chúng ta có thể sử dụng tuổi/10 hay n.)
Mục đích chuyển sang giá trị trung tâm giúp cho việc phân tích mô hình và phiên giải tốt hơn và phù hợp hơn

. egen  meanage = mean(age)

. gen cage= age – meanage

Lưu ý: 2 biến tô đậm trên là chúng ta tự đặt, các bạn có thể thay đổi.

Vậy là chúng ta đã xong việc chuyển giá trị tuổi sang giá trị trung tâm.

Kết luận 2: Chúng ta có biến mới là biến tuổi trung tâm (cage)

Bước 3: Chạy mô hình

Câu lệnh:

. reg lncre cage

      Source |       SS       df       MS              Number of obs =    2761
-------------+------------------------------           F(  1,  2759) =   88.99
       Model |  3.90984215     1  3.90984215           Prob > F      =  0.0000
    Residual |  121.215403  2759  .043934543           R-squared     =  0.0312
-------------+------------------------------           Adj R-squared =  0.0309
       Total |  125.125245  2760  .045335234           Root MSE      =  .20961

------------------------------------------------------------------------------
       lncre |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        cage |   .0056555   .0005995     9.43   0.000     .0044799     .006831
       _cons |   .0534922   .0039891    13.41   0.000     .0456704    .0613141




Việc tiếp theo đó là chúng ta kiểm tra mô hình có phù hợp hay không. Tất nhiên có nhiều giá trị cho chúng ta phiên giải: Như giá trị R2 (3%) hay các giá trị cage.
Lncre = 0.053 + 0.0056cage

Nhưng ở đây tôi cố tập trung vào Kiểm tra độ mạnh của mô hình bằng biểu đồ scatter bằng cách tạo ra phần dư và các giá trị phù hợp

predict fitted, xb
predict resid, residuals

Bằng 1 trong 2 cách sau

1.  twoway (scatter lncre cage ) (lfit lncre cage), name(twoway,replace)

2.  scatter res fit, yline(0)

Vậy chứng tỏ mô hình phù hợp (Cứ nhìn vào hình không ra hình dạng gì là được - ah, đang nghi cái biểu đồ ni có vấn đề. Ai chạy ra khác báo liền hi để thay đổi)























Nhận xét

Bài đăng phổ biến từ blog này

Phần mềm dinh dưỡng tính khẩu phần ăn - Hướng dẫn phần mềm Vietnam Eiyokun

bạn muốn biết bạn đã ăn bao nhiêu kcal protit, lipip, gluxit, bao nhiêu g vitamin và vô số chất dinh dưỡng khác trong bữa ăn hằng ngày? làm thế nào để tính được 1 người nặng 100 kg cao 1m80 mỗi ngày cần bao nhiêu protit, lipip, gluxit? 1 công việc quá đơn giản đối với 1 nhà dinh dưỡng chuyên nghiệp. vấn đề là chúng ta thường là các nhà dinh dưỡng không chuyên. nhưng với phần mềm Vietnam Eiyokun tất cả chúng ta đều trở thành những nhà bán chuyên nghiệp. các bạn download hướng dẫn tại đây Bản cài đặt tại đây . pass mở file là itcchue code là A020400312

Các phép tính đơn giản ứng dụng trong SPSS - Lệnh Compute

Xin nhắc lại đây là những bài viết ở mức độ hướng dẫn cơ bản và mang tính chất cá nhân nên không thể tránh sai sót. Chỉ là mang tính chất xây dựng nguồn tài liệu của YTCC Huế Chủ đề hôm nay là thực hiện các phép tính cơ bản: Đơn giản muốn tính BMI trong SPSS. Bạn làm thế nào, trong khi đã có dữ kiện là Cân nặng, chiều cao (cm). BMI = (Cân nặng/(Chiều cao* chiều cao)*10000) Mô tả bằng hình ảnh trong SPSS. H1:  H2 Bạn trở lại cửa sổ Variable View sẽ thấy 1 biến mới "BMI" xuất hiện. Nó là kết quả của việc thực hiện thuât toán trên. Xin lỗi là công thức trên thiếu 1 dấu ")" cuối cùng trong hình 2. Thks đã đọc TBT Ytcchue.blogspot.com

Recode – mã hoá lại biến trong Stata

Lệnh recode giúp ta mã hoá lại các giá trị của biến theo những điều kiện được đưa ra. Giá trị nào không phù hợp với biểu thức điều kiện sẽ không bị thay đổi, ngoại trừ phù hợp với những điều kiện kèm theo. Câu lệnh như sau: recode danh sách biến (biểu thức điều kiện) [biểu thức điều kiện] [if] [in] [, tuỳ chọn]