Chuyển đến nội dung chính

Visitors (statistics)

Chọn mẫu ngẫu nhiên từ file số liệu có sẵn trong Stata v12


Sử dụng câu lệnh sau

. webuse nlswork

Để tải về máy bộ số liệu  National Longitudinal Survey.  Young Women 14-26 years of age in 1968 về máy.
Dùng lệnh de, short để có được mô tả tóm tắt về số liệu này.
Số liệu này có tất cả 28,534 bản ghi. Bây giờ, bạn muốn tạo một mẫu từ số liệu này, giả sử bạn muốn tạo ra một dữ liệu khác, bao gồm 20% bản ghi của số liệu gốc, bạn sử dụng lệnh sau:



. sample 10
. de , short
---------------------------------------------------------------------------------------------------------------------------

. webuse nlswork, clear
. tab race

   1=white, |
   2=black, |
    3=other |      Freq.     Percent        Cum.
------------+-----------------------------------
          1 |     20,180       70.72       70.72
          2 |      8,051       28.22       98.94
          3 |        303        1.06      100.00
------------+-----------------------------------
      Total |     28,534      100.00

Giả sử tại biến race, ta chỉ muốn giữ lại 10% giá trị race = 1, còn các giá trị khác số lượng không đổi, ta thực hiện lệnh sau:

. sample 10 if race==1

Gõ lệnh tab race để kiểm tra kết quả

. tab race

   1=white, |
   2=black, |
    3=other |      Freq.     Percent        Cum.
------------+-----------------------------------
          1 |      2,018       19.46       19.46
          2 |      8,051       77.62       97.08
          3 |        303        2.92      100.00
------------+-----------------------------------
      Total |     10,372      100.00

---------------------------------------------------------------------------------------------------------------------------
. webuse nlswork, clear

Giả sử ta muốn giữ lại 10% mỗi lựa chọn của biến race, ta làm như sau:

. sample 10, by(race)

. tab race

. webuse nlswork, clear

Giả sử bạn muốn tạo một một bộ số liệu mới có chính xác 100 bản ghi, bạn thực hiện như sau:

. sample 100, count

. de , short để xem kết quả
---------------------------------------------------------------------------------------------------------------------------
. webuse nlswork, clear

Giả sử bạn muốn tạo một số liệu mới bao gồm 100 người đã kết hôn và 100 người chưa kết hôn ở biến msp, ta thực hiện như sau:

. sample 100, count by(msp)
. tab msp

       1 if |
   married, |
     spouse |
    present |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |        100       50.00       50.00
          1 |        100       50.00      100.00
------------+-----------------------------------
      Total |        200      100.00

---------------------------------------------------------------------------------------------------------------------------
Tóm tắt
Tạo ngẫu nhiên một mẫu bằng #% bản ghi số liệu cũ.
. sample 20%

Tạo một mẫu với điều kiện mẫu mới có giá trị x trong biến điều kiện bằng #% trong số liệu cũ, các giá trị khác của biến đó không thay đổi.
. sample 10, if race==1
Tạo một mẫu với điều kiện mẫu mới có các giá trị trong biến điều kiện bằng #% trong biến cũ.
. sample 10, by(race)
Tạo một mẫu có # bản ghi
. sample 100, count
Tạo một mẫu có x bản ghi cho từng giá trị của biến điều kiện
. sample 100, count by(msp)
 

Nhận xét

Bài đăng phổ biến từ blog này

Phần mềm dinh dưỡng tính khẩu phần ăn - Hướng dẫn phần mềm Vietnam Eiyokun

bạn muốn biết bạn đã ăn bao nhiêu kcal protit, lipip, gluxit, bao nhiêu g vitamin và vô số chất dinh dưỡng khác trong bữa ăn hằng ngày? làm thế nào để tính được 1 người nặng 100 kg cao 1m80 mỗi ngày cần bao nhiêu protit, lipip, gluxit? 1 công việc quá đơn giản đối với 1 nhà dinh dưỡng chuyên nghiệp. vấn đề là chúng ta thường là các nhà dinh dưỡng không chuyên. nhưng với phần mềm Vietnam Eiyokun tất cả chúng ta đều trở thành những nhà bán chuyên nghiệp. các bạn download hướng dẫn tại đây Bản cài đặt tại đây . pass mở file là itcchue code là A020400312

Các phép tính đơn giản ứng dụng trong SPSS - Lệnh Compute

Xin nhắc lại đây là những bài viết ở mức độ hướng dẫn cơ bản và mang tính chất cá nhân nên không thể tránh sai sót. Chỉ là mang tính chất xây dựng nguồn tài liệu của YTCC Huế Chủ đề hôm nay là thực hiện các phép tính cơ bản: Đơn giản muốn tính BMI trong SPSS. Bạn làm thế nào, trong khi đã có dữ kiện là Cân nặng, chiều cao (cm). BMI = (Cân nặng/(Chiều cao* chiều cao)*10000) Mô tả bằng hình ảnh trong SPSS. H1:  H2 Bạn trở lại cửa sổ Variable View sẽ thấy 1 biến mới "BMI" xuất hiện. Nó là kết quả của việc thực hiện thuât toán trên. Xin lỗi là công thức trên thiếu 1 dấu ")" cuối cùng trong hình 2. Thks đã đọc TBT Ytcchue.blogspot.com

Recode – mã hoá lại biến trong Stata

Lệnh recode giúp ta mã hoá lại các giá trị của biến theo những điều kiện được đưa ra. Giá trị nào không phù hợp với biểu thức điều kiện sẽ không bị thay đổi, ngoại trừ phù hợp với những điều kiện kèm theo. Câu lệnh như sau: recode danh sách biến (biểu thức điều kiện) [biểu thức điều kiện] [if] [in] [, tuỳ chọn]