Sử dụng câu lệnh sau
. webuse nlswork
Để tải về máy bộ số liệu National Longitudinal Survey. Young Women 14-26 years of age in 1968 về máy.
Dùng lệnh de, short để có được mô tả tóm
tắt về số liệu này.
Số liệu này có tất cả 28,534 bản ghi. Bây giờ,
bạn muốn tạo một mẫu từ số liệu này, giả sử bạn muốn tạo ra một dữ liệu khác,
bao gồm 20% bản ghi của số liệu gốc, bạn sử dụng lệnh sau:
. sample 10
. de , short
---------------------------------------------------------------------------------------------------------------------------
. webuse nlswork, clear
. tab race
1=white, |
2=black, |
3=other | Freq.
Percent Cum.
------------+-----------------------------------
1 | 20,180 70.72 70.72
2 | 8,051 28.22 98.94
3 | 303 1.06 100.00
------------+-----------------------------------
Total | 28,534
100.00
Giả sử tại biến race, ta chỉ muốn giữ lại 10% giá trị
race = 1, còn các giá trị khác số lượng không đổi, ta thực hiện lệnh sau:
. sample 10 if race==1
Gõ lệnh tab race để kiểm tra kết quả
. tab race
1=white, |
2=black, |
3=other | Freq.
Percent Cum.
------------+-----------------------------------
1 | 2,018 19.46 19.46
2 | 8,051 77.62 97.08
3 | 303 2.92 100.00
------------+-----------------------------------
Total | 10,372
100.00
---------------------------------------------------------------------------------------------------------------------------
. webuse nlswork, clear
Giả sử ta muốn giữ lại 10% mỗi lựa chọn của biến race,
ta làm như sau:
. sample 10, by(race)
. tab race
. webuse nlswork, clear
Giả sử bạn muốn tạo một một bộ số liệu mới có chính
xác 100 bản ghi, bạn thực hiện như sau:
. sample 100, count
. de , short để xem kết quả
---------------------------------------------------------------------------------------------------------------------------
. webuse nlswork, clear
Giả sử bạn muốn tạo một số liệu mới bao gồm 100 người
đã kết hôn và 100 người chưa kết hôn ở biến msp, ta thực hiện như sau:
. sample 100, count by(msp)
. tab msp
1 if |
married, |
spouse |
present | Freq.
Percent Cum.
------------+-----------------------------------
0 | 100 50.00 50.00
1 | 100 50.00 100.00
------------+-----------------------------------
Total | 200
100.00
---------------------------------------------------------------------------------------------------------------------------
Tóm tắt
Tạo ngẫu nhiên một mẫu bằng #% bản ghi số liệu cũ.
. sample 20%
Tạo một mẫu với điều kiện mẫu mới có giá trị x trong
biến điều kiện bằng #% trong số liệu cũ, các giá trị khác của biến đó không
thay đổi.
. sample 10, if race==1
Tạo một mẫu với điều kiện mẫu mới có các giá trị trong
biến điều kiện bằng #% trong biến cũ.
. sample 10, by(race)
Tạo một mẫu có # bản ghi
. sample 100, count
Tạo một mẫu có x bản ghi cho từng giá trị của biến
điều kiện
. sample 100, count by(msp)
Nhận xét