Chuyển đến nội dung chính

Visitors (statistics)

Một số tips trong R

Sưu tầm
Tôi thấy việc xử lý file excel (.xls, .xlsx) có vẻ khó khăn và đòi hỏi nhiều động tác. T tìm thấy package 'gdata' có thể giúp việc đọc file excel khá hiệu quả và muốn chia sẻ với mọi người ở đây.


Gói 'gdata' hỗ trợ R đọc file xls trực tiếp mà không cần file chuyển file xls sang csv. Cách tôi đọc file .xls bằng R trên máy của tôi như sau:
-------
install.packages("gdata")
library(gdata)
setwd("~/Dropbox/lectures/TAI LIEU/TAI LIEU/Datafiles")
data = read.xls("test excel file 1.xls")
--------
Lưu ý: các anh chị sử dụng windows có thể gặp khó khăn khi gài gói 'gdata' vì phải cài thêm phần mềm perl. Các anh chị sử dụng Linux/Mac OS thì perl thường đã có sẵn trong máy.
Hi vọng thông tin này sẽ hữu ích cho các anh chị quan tâm!


Recode
Bài thực hành trong câu 10, ý số 4
"Soạn biểu đồ về tần số (bar graph) của số người bị obese, overweight, và normal cho từng giới tính"
Mọi người sẽ thấy hơi lạ vì nó hơi lạ. Thực ra nó là kết quả của câu 2, ý số 3:
Tạo ra một biến mới và gọi là "obesity", sao cho obesity có giá trị theo điều kiện
sau đây:
* Nếu bmi bằng hoặc cao hơn 30 thì obesity có giá trị "Obese";
* Nếu bmi từ 25 đến đến 29.9 thì obesity có giá trị "Overweight";
* Nếu bmi thấp hơn 25 thì obesity có giá trị "Normal".
Cho nên bài này làm thành 2 bước:
Bước 1: Chạy lại lệnh trong câu 2:
data$obesity[bmi >= 30] = "Obsese";
data$obesity[(25 <= bmi) & (bmi <= 29.9)] = "Overweight";
data$obesity[bmi < 25] = "Normal";
Bước 2:
attach(data);
tabObesity = table(obesity);
barplot(tabObesity);

ROC

library (OptimalCutpoints);
#tag.healthy: giá trị không bệnh.;
cutpoint= optimal.cutpoints (X = "tên biến predictor", status = "tên biến kết cục", tag.healthy = 0, methods = "ROC01", data = tên data, ci.fit = TRUE, conf.level = 0.95);

summary (cutpoint)


Nhận xét

Bài đăng phổ biến từ blog này

Phần mềm dinh dưỡng tính khẩu phần ăn - Hướng dẫn phần mềm Vietnam Eiyokun

bạn muốn biết bạn đã ăn bao nhiêu kcal protit, lipip, gluxit, bao nhiêu g vitamin và vô số chất dinh dưỡng khác trong bữa ăn hằng ngày? làm thế nào để tính được 1 người nặng 100 kg cao 1m80 mỗi ngày cần bao nhiêu protit, lipip, gluxit? 1 công việc quá đơn giản đối với 1 nhà dinh dưỡng chuyên nghiệp. vấn đề là chúng ta thường là các nhà dinh dưỡng không chuyên. nhưng với phần mềm Vietnam Eiyokun tất cả chúng ta đều trở thành những nhà bán chuyên nghiệp. các bạn download hướng dẫn tại đây Bản cài đặt tại đây . pass mở file là itcchue code là A020400312

Các phép tính đơn giản ứng dụng trong SPSS - Lệnh Compute

Xin nhắc lại đây là những bài viết ở mức độ hướng dẫn cơ bản và mang tính chất cá nhân nên không thể tránh sai sót. Chỉ là mang tính chất xây dựng nguồn tài liệu của YTCC Huế Chủ đề hôm nay là thực hiện các phép tính cơ bản: Đơn giản muốn tính BMI trong SPSS. Bạn làm thế nào, trong khi đã có dữ kiện là Cân nặng, chiều cao (cm). BMI = (Cân nặng/(Chiều cao* chiều cao)*10000) Mô tả bằng hình ảnh trong SPSS. H1:  H2 Bạn trở lại cửa sổ Variable View sẽ thấy 1 biến mới "BMI" xuất hiện. Nó là kết quả của việc thực hiện thuât toán trên. Xin lỗi là công thức trên thiếu 1 dấu ")" cuối cùng trong hình 2. Thks đã đọc TBT Ytcchue.blogspot.com

Recode – mã hoá lại biến trong Stata

Lệnh recode giúp ta mã hoá lại các giá trị của biến theo những điều kiện được đưa ra. Giá trị nào không phù hợp với biểu thức điều kiện sẽ không bị thay đổi, ngoại trừ phù hợp với những điều kiện kèm theo. Câu lệnh như sau: recode danh sách biến (biểu thức điều kiện) [biểu thức điều kiện] [if] [in] [, tuỳ chọn]