Thứ Sáu, 31 tháng 12, 2010

Giới thiệu sách hay - Dịch tễ học cơ bản WHO

Thông điệp chính:
- là khoa học nền tảng của Y tế công cộng
- Đóng góp lớn vào việc cải thiện sức khỏe cộng đồng
- Là công cụ thiết yếu trong quá trình xác định và sắp xếp (mapping) các bệnh nổi trội
- Thường xuyên có tình trạng chậm chễ giữa việc thu thập các bằng chứng DTH và ứng dụng bằng chứng này vào việc xây dựng chính sách y tế

Phiên bản tiếng Anh: whqlibdoc.who.int/publications/2006/9241547073_eng.pdf
Phiên bản tiếng Việt liên lạc Thắng cho mượn photo (Copy right from Dr Hòa)

Thứ Hai, 13 tháng 12, 2010

PHÂN TÍCH HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

PHÂN TÍCH HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
(Simple Linear Regression Analysis)

Phân tích hồi qui tuyến tích đơn giản là tìm sự liên hệ giữa 1 biến số độc lập (biến dự đoán) trên trục hoành x với 1 biến số phụ thuộc (biến kết cục) trên trục tung y. Sau đó vẻ 1 đường thẳng hồi qui và từ phương trình đường thẳng này ta có thể dự đoán được biến y (ví dụ: cân nặng)  khi đã có x (ví dụ: tuổi)
Ví dụ 1: Ta có 1 mẫu gồm 6 trẻ từ 1-6 tuổi, có cân nặng như bảng sau:

Tuổi
Cân nặng (kg)
1
10
2
12
3
14
4
16
5
18
6
20

Nối các cặp (x,y) này ta thấy có dạng 1 phương trình bậc nhất: y=2x+8
(trong đó 2 là độ dốc và 8 là điểm cắt trên trục tung y khi x=0). Trong thống kê phương trình đường thẳng (bậc nhất) này được viết dưới dạng:

y= bx + a   [1]
Đây là phương trình hối qui tuyến tính, trong đó b gọi là slope (độ dốc) và a là intercept (điểm cắt trên trục tung)
Thực ra phương trình hồi qui tuyến tính này chỉ có trên lý thuyết, nghĩa là các trị số của xi (i=1,2,3,4,5,6) và yi tương ứng liên hệ 100% (hoặc hệ số tương quan R=1)  
Trong thực tế hiếm khi có sư liên hệ 100% nàythường   sự sai lệch giữa trị số quan sát yi và trị số yi  ước đoán nằm trên đường hối qui.
Ví dụ 2: Ta 1 mẫu gồm 6 trẻ em khác có cân nặng theo bảng sau:

Tuổi
Cân nặng (kg)
1
11
2
11
3
14
4
16
5
18
6
20



Khi vẽ đường thẳng hồi qui, ta thấy các trị số quan sát y3, y4, y5, y6 nhưng y1 và y2 không nằm trên trên đường thẳng này và sự liên hệ giữa xi và  yi không còn là 100% mà chỉ còn 97% vì có sự sai lệch tại y1y2. Sự sai lệch này trong thống kê gọi là phần dư (Residual) hoặc Errors.
Gọi y1, y2, y3, y4, y5, y6 là trị số quan sát và y’1, y’2, y’3, y’4, y’5, y’6 là trị số ước đoán nằm trên đường hồi qui, e1, e2, e3, e4, e5, e6 là phần dư.
Như vậy              e1= y1 –y’1
e2 = y2y’2
e3 = y3y’3
e4 = y4y’4
e5 = y5y’5
e6 = y6y’6
   Khi đó phương trình hi qui tuyến tính được viết dưới dạng tổng quát như sau:
y’= βxi + ai+ ei   [2]
Như vậy nếu phần dư ei  càng nhỏ sự liên hệ giữa x,y càng lớn và ngược lại. Phần liên hệ còn đượi gọi là phần hồi qui. Mô hình hồi qui tuyến tích được mô tả:

Dữ liệu= Hồi qui (Regression) + Phần dư (Residual)


Ví dụ 3: Nếu chúng ta chọn một mẫu thực tế gồm 30 em từ 1-6 tuổi và kết quả cân nặng tương ứng của 30 em được vẻ  trong biểu đồ sau:


Lúc này ta không thể nối 30 điểm trên biểu đồ mà phải vẽ 1 đường thẳng đi càng gần với tất cả  các điểm càng tốt. Như vậy 3 đường thẳng ở biểu đồ ta chọn đường thẳng nào?. Nguyên tắc chọn đường thẳng nào đi gần cả 30 đim, có nghĩa làm sao để tổng các phần dư Sei nhỏ nhất:
S ei= S (yi- βx – α)
và tổng bình phương của phần dư:
S (ei)2= S (yi- βx – α)2
Đây là phương trình bậc 2 theo x. Trong toán học, muốn tìm trị cực tiểu của 1 phương trình bậc 2, người ta lấy đạo hàm và cho đạo hàm triệt tiêu (bằng 0) sẽ tím được trị cực tiểu của x. Giải phương trình này, ta sẽ tính được 2 thông số ba và từ 2 thông số này ta sẽ vẽ được đường thẳng hồi qui. Phương pháp này trong toán học gọi là phương pháp bình phương nhỏ nhất (least square method).
Giải phương trình trên ta có:
b =  r
(r là hệ số tương quan; Sy là độ lệch chuẩn của y và Sx là độ lệch chuẩn của x)
r = S ( ) ( )
a= y - bx
và phương trình hồi qui tuyến tính của y theo x (bình phương nhỏ nhất) là: 
  y’ = βxi + a
Dùng phần mềm SPSS để vẻ đường hồi qui đồng thời tính phần hồi qui và phần dư của mô hình. Nhập số liệu tuổi và cân nặng cân được của 30 trẻ 1-6 tuổi vào SPSS: 
Nhập số liệu vào SPSS
Vào menu >Analyze> Regression> Linear

Bảng 1. Tóm tắt mô hình
Hệ số tương quan R=0,918 và R2=0,843

Bảng 2. Phân tích ANOVA với biến phụ thuộc là cân nặng
Tổng bình phương phần hồi qui (Regression)=336,14
Tổng bình phương phần dư (Residual)=62,8
Trung bình bình phương hồi qui: 336,14/ 1 (bậc tự do)=336,14
Trung bình bình phương phần dư: 62,8/ 28(bậc tự do=n-2)=2,24
F=  = 149,8 và p<0,000

Bảng 3. thông số ba
Kết quả bảng 3 cho biết độ dốc b= 1,96 và điểm cắt tại trung tung là a=7.773
Phương trình đường thẳng hồi qui là:

Cân nặng= 1,96 x tuồi + 7,77

Như vậy khi em bé tăng lên 1 tuổi thì cân nặng tăng lên 1,96 kg
Vẽ đường thẳng hồi qui trong SPSS

Từ phương trình này ta có thể ước đoán được cân nặng theo tuổi của trẻ, tuy nhiên nằm trong một giới hạn nào đó, chẳng hạn như từ 1-12 tuổi, vì sau tuổi này là thời kỳ dậy thì, cân nặng của trẻ sẽ tăng vọt so với tuổi.


Ví dụ muốn ước đoán cân nặng của trẻ  từ quần thể nghiên cứu này:
7 tuổi ð Cân nặng= 1,96 x7 + 7,77 = 21,49 kg
8 tuổi ð Cân nặng= 1,96 x8 + 7,77 = 23,45 kg


Nguồn: Sưu tầm nguyên bài viết BSRang
Bài viết còn tiếp về HD vẽ biểu đồ hình chấm trong Excel 07(Có thể vẽ trong SPSS nhưng không đẹp lắm nên dùng excel). Bạn đọc nhớ đón đọc nghen. Mình sẽ update trong thời gian tới.
TBT_YTCC07
Nguồn: Ytcchue.blogspot.com

Chiến lược học tập hiệu quả dành cho học sinh, sinh viên

Từ: http://skills.hieuhoc.com
Hệ quả của phương pháp học không tốt là lãng phí thời gian, thành tích học tập kém, thậm chí thi rớt dẫn đến chán nản, thất vọng và bất mãn. Học đối với học sinh, sinh viên là cuộc sống, là tương lai. Vậy nên thời gian học tập vô cùng quý giá, không thể lãng phí được. Do đó, ngay ngày hôm nay, các bạn hãy tạo và phát triển nơi mình một kĩ năng học tập có hiệu quả.


Graham Best, một giảng viên với 30 năm trong nghề phát biểu: "Tôi đã thấy trong khi có những học sinh, sinh viên luôn nhận được điểm tuyệt đối thì cũng có những học sinh, sinh viên phải học đi học lại mà vẫn thi trượt."


Và theo ông một trong những yếu tố cốt lõi, ảnh hưởng đến kết quả học tập, điểm số đạt được, đó chính là phương pháp học tập và tự học. Trong Video dưới đây, ông Best có đưa ra một số những bí quyết giúp bạn có thể học tập một cách hiệu quả, tận dụng tối đa thời gian học tập để có thể lĩnh hội được nhiều kiến thức nhất cũng như đạt kết quả cao trong học tập.


Thứ Tư, 8 tháng 12, 2010

Trị số P trong NCKH - Tại sao người ta hay chọn 0.05. Đúng hay sai?

Trị số P trong NCKH  - Tại sao người ta hay chọn 0.05 ?
Thấy đây là cái cơ sở mà sinh viên lẫn người nghiên cứu còn mơ hồ và đôi khi sai. Và khá nhiều nghiên cứu dù làm xong nhưng không dám ứng dụng. Có nhiều nguyên nhân để giải thích điều này. Tuy nhiên, theo mình đơn giản trị số P chưa hiểu cặn kẻ và sai trong phương pháp làm.
Xin trích nguyên bài viết của GS NVT  về trị số P (Bài viết có vài chổ bị xóa đi. Bạn đọc có thể lấy nguyên file gốc ở Ykhoa.net hoặc Nguyenvantuan.com)

 
1.  Trị số P
Trị số P là một con số xác suất, tức là viết tắt chữ “probability value”. Chúng ta thường gặp những phát biểu được kèm theo con số, chẳng hạn như “Kết quả phân tích cho thấy tỉ lệ gãy xương trong nhóm bệnh nhân được điều trị bằng thuốc Alendronate là 2%, thấp hơn tỉ lệ trong nhóm bệnh nhân không được chữa trị (5%), và mức độ khác biệt này có ý nghĩa thống kê (p = 0.01)”, hay một phát biểu như “Sau 3 tháng điều trị, mức độ giảm áp suất máu trong nhóm bệnh nhân là 10% (p < 0.05)”. Trong văn cảnh trên đây, đại đa số nhà khoa học hiểu rằng trị số P phản ánh xác suất sự hiệu nghiệm của thuốc Alendronate hay một thuật điều trị, họ hiểu rằng câu văn trên có nghĩa là “xác suất mà thuốc Alendronate tốt hơn giả dược là 0.99” (lấy 1 trừ cho 0.01). Nhưng cách hiểu đóhoàn toàn sai!
 Trong “Từ điển toán kinh tế thống kê, kinh tế lượng Anh – Việt” (Nhà xuất bản Khoa học và Kĩ thuật, 2004), tác giả định nghĩa trị số P như sau: “P – giá trị (hoặc giá trị xác suất). P giá trị là mức ý nghĩa thống kê thấp nhất mà ở đó giá trị quan sát được của thống kê kiểm định có ý nghĩa” (trang 690). Định nghĩa này thật là khó hiểu! Thật ra đó cũng là định nghĩa chung mà các sách khoa Tây phương thường hay viết. Lật bất cứ sách giáo khoa nào bằng tiếng Anh, chúng ta sẽ thấy một định nghĩa về trị số P na ná giống nhau như “Trị số P là xác suất mà mức độ khác biệt quan sát do các yếu tố ngẫu nhiên gây ra (P value is the probability that the observed difference arose by chance)”.
Thật ra định nghĩa này chưa đầy đủ, nếu không muốn nói là … sai. Chính vì sự mù mờ của định nghĩa cho nên rất nhiều nhà khoa học hiểu sai ý nghĩa của trị số P.
 Thật vậy, rất nhiều người, không chỉ người đọc mà ngay cả chính các tác giả của những bài báo khoa học, không hiểu ý nghĩa của trị số P. Theo một nghiên cứu được công bố trên tập san danh tiếng Statistics in Medicine [1], tác giả cho biết 85% các tác giả khoa học và bác sĩ nghiên cứu không hiểu hay hiểu sai ý nghĩa của trị số P. Đọc đến đây có lẽ bạn đọc rất ngạc nhiên, bởi vì điều này có nghĩa là nhiều nhà nghiên cứu khoa học có khi không hiểu hay hiểu sai những gì chính họ viết ra có nghĩa gì! Thế thì, câu hỏi cần đặt ra một cách nghiêm chỉnh: Ý nghĩa của trị số P là gì? Để trả lời cho câu hỏi này,chúng ta cần phải xem xét qua khái niệm phản nghiệm và tiến trình của một nghiên cứu khoa học.

2 Giả thiết khoa học và phản nghiệm
Một giả thiết được xem là mang tính “khoa học” nếu giả thiết đó có khả năng “phản nghiệm”. TheoKarl Popper, nhà triết học khoa học, đặc điểm duy nhất để có thể phân biệt giữa một lí thuyết khoa học thực thụ với ngụy khoa học (pseudoscience) là thuyết khoa học luôn có đặc tính có thể “ bị bác bỏ” (hay bị phản bác – falsified) bằng những thực nghiệm đơn giản. Ông gọi đó là “khả năng phản nghiệm” (falsifiability, có tài liệu ghi là falsibility). Phép phản nghiệm là phương cách tiến hành những thực nghiệm không phải để xác minh mà để phê phán các lí thuyết khoa học, và có thể coi đây như là một nền tảng cho khoa học thực thụ. Chẳng hạn như giả thiết “Tất cả các quạ đều màu đen” có thể bị bác bỏ nếu ta tìm ra có một con quạ màu đỏ.
Có thể xem qui trình phản nghiệm là một cách học hỏi từ sai lầm! Thật vậy, trong khoa học chúng ta học hỏi từ sai lầm. Khoa học phát triển cũng một phần lớn là do học hỏi từ sai lầm mà giới khoa học không ai chối cãi. Sai lầm là điểm mạnh của khoa học. Có thể xác định nghiên cứu khoa học như là một qui trình thử nghiệm giả thuyết, theo các bước sau đây:

Bước 1, nhà nghiên cứu cần phải định nghĩa một giả thuyết đảo (null hypothesis), tức là một giả thuyết ngược lại với những gì mà nhà nghiên cứu tin là sự thật. Thí dụ trong một nghiên cứu lâm sàng, gồm hai nhóm bệnh nhân: một nhóm được điều trị bằng thuốc A, và một nhóm được điều trị bằng placebo, nhà nghiên cứu có thể phát biểu một giả thuyết đảo rằng sự hiệu nghiệm thuốc A tương đương với sự hiệu nghiệm của placebo (có nghĩa là thuốc A không có tác dụng như mong muốn).

Bước 2, nhà nghiên cứu cần phải định nghĩa một giả thuyết phụ (alternative hypothesis), tức là một giả thuyết mà nhà nghiên cứu nghĩ là sự thật, và điều cần được “chứng minh” bằng dữ kiện. Chẳng hạn như trong ví dụ trên đây, nhà nghiên cứu có thể phát biểu giả thuyết phụ rằng thuốc A có hiệu nghiệm cao hơn placebo.

Bước 3, sau khi đã thu thập đầy đủ những dữ kiện liên quan, nhà nghiên cứu dung một hay nhiều phương pháp thống kê để kiểm tra xem trong hai giả thuyết trên, giả thuyết nào được xem là khả dĩ. Cách kiểm tra này được tiến hành để trả lời câu hỏi: nếu giả thuyết đảo đúng, thì xác suất mà những dữ kiện thu thập được phù hợp với giả thuyết đảo là bao nhiêu. Giá trị của xác suất này thường được đề cập đến trong các báo cáo khoa học bằng kí hiệu “P value”. Điều cần chú ý ở đây là nhà nghiên cứu không thử nghiệm giả thuyết khác, mà chỉ thử nghiệm giả thuyết đảo mà thôi.

Bước 4, quyết định chấp nhận hay loại bỏ giả thuyết đảo, bằng cách dựa vào giá trị xác suất trong bước thứ ba. Chẳng hạn như theo truyền thống lựa chọn trong một nghiên cứu y học, nếu giá trị xác suất nhỏ hơn 5% thì nhà nghiên cứu sẵn sàng bác bỏ giả thuyết đảo: sự hiệu nghiệm của thuốc A khác với sự hiệu nghiệm của placebo. Tuy nhiên, nếu giá trị xác suất cao hơn 5%, thì nhà nghiên cứu chỉ có thể phát biểu rằng chưa có bằng chứng đầy đủ để bác bỏ giả thuyết đảo, và điều này không có nghĩa rằng giả thuyết đảo là đúng, là sự thật. Nói một cách khác, thiếu bằng chứng không có nghĩa làkhông có bằng chứng.

Bước 5, nếu giả thuyết đảo bị bác bỏ, thì nhà nghiên cứu mặc nhiên thừa nhận giả thuyết phụ. Nhưng vấn đề khởi đi từ đây, bởi vì có nhiều giả thuyết phụ khác nhau. Chẳng hạn như so sánh với giả thuyết phụ ban đầu (A khác với Placebo), nhà nghiên cứu có thể đặt ra nhiều giả thuyết phụ khác nhau như thuốc sự hiệu nghiệm của thuốc A cao hơn Placebo 5%, 10% hay nói chung X%. Nói tóm lại, một khi nhà nghiên cứu bác bỏ giả thuyết đảo, thì giả thuyết phụ được mặc nhiên công nhận, nhưng nhà nghiên cứu không thể xác định giả thuyết phụ nào là đúng với sự thật.
Phần này ngay cả bản thân tôi vẫn còn hạn chế trong diễn đạt nên không thể đưa phần của GS NVT vào. Bạn đọc có thể lấy nguyên file của GS Tuấn đọc lại.

3. Vấn đề logic của trị số P
 Nhưng đứng trên phương diện lí trí và khoa học nghiêm chỉnh, chúng ta có nên đặt tầm quan trọng vào trị số P như thế hay không? Theo tôi, câu trả lời là không. Trị số P có nhiều vấn đề, và việc phụ thuộc vào nó trong quá khứ (cũng như hiện nay) đã bị rất nhiều người phê phán gay gắt. Cái khiếm khuyết số 1 của trị số P là nó thiếu tính logic. Thật vậy, nếu chúng ta chịu khó xem xét lại ví dụ trên, chúng ta có thể khái quát tiến trình của một nghiên cứu y học (dựa vào trị số P) như sau:
Đề ra một giả thuyết chính (H+)
Từ giả thuyết chính, đề ra một giả thuyết đảo (H-)
Tiến hành thu thập dữ kiện (D)
Phân tích dữ kiện: tính toán xác suất D xảy ra nếu H- là sự thật. Nói theo ngôn ngữ toán xác suất, bước này xác định P(D | H-).
Vì thế, con số P có nghĩa là xác suất của dữ kiện D xảy ra nếu (nhấn mạnh: “nếu”) giả
 thuyết đảo H- là sự thật. Như vậy, con số P không trực tiếp cho chúng ta một ý niệm gì về sự thật của giả thuyết chính H; nó chỉ gián tiếp cung cấp bằng chứng để chúng ta chấp nhận giả thuyết chính và bác bỏ giả thuyết đảo.
Cái logic đằng sau của trị số P có thể được hiểu như là một tiến trình chứng minh đảo ngược (proof by contradiction):
Mệnh đề 1: Nếu giả thuyết đảo là sự thật, thì dữ kiện này không thể xảy ra;
Mệnh đề 2: Dữ kiện xảy ra;
Mệnh đề 3 (kết luận): Giả thuyết đảo không thể là sự thật.


Nếu bạn đọc cảm thấy khó hiểu cách lập luận trên, tôi xin lấy thêm một ví dụ
trong y khoa để minh họa cho tiến trình này:
-          Nếu ông Tuấn bị cao huyết áp, thì ông không thể có triệu chứng rụng tóc (hai hiện tượng sinh học này không liên quan với nhau, ít ra là theo kiến thức y khoa hiện nay);
-          Ông Tuấn bị rụng tóc;
-          Do đó, ông Tuấn không thể bị cao huyết áp. 
số Trị số P, do đó, gián tiếp phản ánh xác suất của mệnh đề 3. Và đó cũng chính là một khiếm khuyết quan trọng của trị số P, bởi vì con số P nó ước tính mức độ khả dĩ của dữ kiện, chứ không nói cho chúng ta biết mức độ khả dĩ của một giả thuyết. Điều này làm cho việc suy luận dựa vào trị số P rất xa rời với thực tế, xa rời với khoa học thực nghiệm. Trong khoa học thực nghiệm, điều mà nhà nghiên cứu muốn biết là với dữ kiện mà họ có được, xác suất của giả thuyết chính là bao nhiêu, chứ họ không muốn biết nếu giả thuyết đảo là sự thật thì xác suất của dữ kiện là bao nhiêu. Nói cách khác và dùng kí hiệu mô tả trên, nhà nghiên cứu muốn biết P(H+ | D), chứ không muốn biết P(D | H+) hay P(D | H-).

4. Vấn đề kiểm định nhiều giả thuyết (multiple tests of hypothesis)
Như đã nói trên, nghiên cứu y học là một qui trình thử nghiệm giả thuyết. Trong một nghiên cứu, ít khi nào chúng ta thử nghiệm chỉ một giả thuyết duy nhất, mà rất nhiều giả thuyết một lược. Chẳng hạn như trong một nghiên cứu về mối liên hệ giữa vitamin D và nguy cơ gãy xương đùi, các nhà nghiên cứu có thể phân tích mối liên hệ tương quan giữa vitamin D và mật độ xương (bone mineral density), giữa vitamin D và nguy cơ gãy xương theo từng giới tính, từng nhóm tuổi, hay phân tích theo các đặc tính lâm sàng của bệnh nhân, v.v… (Xem ví dụ dưới đây). Mỗi một phân tích như thế có thể xem là một thử nghiệm giả thuyết. Ở đây, chúng ta phải đối diện với vấn đề nhiều giả thuyết(multiple tests of hypothesis hay còn gọi là multiple comparisons).


Chú thích: 1 số ngoài ngoặc là số bệnh nhân bị gãy xương đùi trong thời gian theo dõi (7 năm) và số trong ngoặc là tỉ lệ gãy xương tính bằng phần trăm mỗi năm. 2 Tỉ số nguy cơ tương đối (hay relative risk – RR – sẽ giải thích trong một chương sau) được ước tính bằng cách lấy tỉ lệ gãy xương trong nhóm can thiệp chia cho tỉ lệ trong nhóm giả dược; nếu khoảng tin cậy 95% bao gồm 1 thì mức độ khác biệt giữa 2 nhóm không có ý nghĩa thống kê; nếu khoảng tin cậy 95% không bao gồm 1 thì mức độ khác biệt giữa 2 nhóm được xem là có ý nghĩa thống kê (hay p<0.05).

Xin nhắc lại rằng trong mỗi lần thử nghiệm một giả thuyết, chúng ta chấp nhận một sai sót 5% (giả dụ chúng ta chấp nhận tiêu chuẩn p = 0.05 để tuyên bố có ý nghĩa hay không có ý nghĩa thống kê). Vấn đề đặt ra là trong bối cảnh thử nghiệm nhiều giả thuyết là như sau: nếu trong số n thử nghiệm, chúng ta tuyên bố k thử nghiệm “có ý nghĩa thống kê” (tức là p<0.05), thì xác suất có ít nhất một giả thuyết sai là bao nhiêu?

Để trả lời câu hỏi này tôi sẽ bắt đầu bằng một ví dụ đơn giản. Mỗi thử nghiệmchúng ta chấp nhận một xác suất sai lầm là 0.05. Nói cách khác, chúng ta có xác suất đúng là 0.95. Nếu chúng ta thử nghiệm 3 giả thuyết, xác suất mà chúng ta đúng cả ba là [dĩ nhiên]: 0.95 x 0.95 x 0.95 = 0.8574. Như vậy, xác xuất có ít nhất một sai lầm trong ba tuyên bố “có ý nghĩa thống kê” là: 1 – 0.8574 = 0.1426 (tức khoảng 14%).

Nói chung, nếu chúng ta thử nghiệm n giả thuyết, và mỗi lần thử nghiệm chúng ta chấp nhận một xác suất sai lầm là p, thì xác suất có ít nhất 1 sai lầm trong n lần thử đến: 40%.
“Bài học” rút ra từ cách lí giải trên là như sau: nếu chúng ta đọc một bài báo khoa học mà trong đó nhà nghiên cứu tiến hành nhiều thử nghiệm khác nhau với các kết quả trị số p < 0.05, chúng ta có lí do để cho rằng xác suất mà một trong những cái-gọi-là “significant” (hay “có ý nghĩa thống kê”) đó rất cao. Chúng ta cần phải dè dặt với những kết quả phân tích như thế.

Đối với một người làm nghiên cứu, ý nghĩa của vấn đề thử nghiệm nhiều giả thuyết là: không nên “câu cá”. Tôi xin nói thêm về khái niệm “câu cá” trong khoa học. Hãy tưởng tượng, một nhà nghiên cứu muốn tìm hiểu hiệu quả của một thuật điều trị mới cho các bệnh nhân đau khớp. Sau khi xem xét các nghiên cứu đã công bố trong y văn, nhà nghiên cứu quyết định tiến hành một nghiên cứu trên 300 bệnh nhân: phân nửa được điều trị bằng thuật mới, phân nửa chỉ sử dụng giả dược. Sau thời gian theo dõi, thu thập dữ liệu, nhà nghiên cứu phân tích và phát hiện sự khác biệt giữa hai nhóm không có ý nghĩa thống kê. Nói cách khác, thuật điều trị không có hiệu quả. Nhà nghiên cứu không chịu “đầu hàng”, nên tìm cách tìm cho được một kết quả có ý nghĩa thống kê. Ông chia bệnh nhân thành nhiều nhóm theo độ tuổi (trên 50 hay dưới 50), theo giới tính (nam hay nữa), thành phần kinh tế (có thu nhập cao hay thấp), và thói quen (chơi thể thao hay không). Tính chung, ông có 16 nhóm khác nhau, và có thể thử nghiệm 16 lần. Ông “khám phá” thuật điều trị có ý nghĩa thống kê trong nhóm phụ nữ tuổi trên 50 và có thu nhập cao. Và, ông công bố kết quả. Đó là một qui trình làm việc mà giới nghiên cứu khoa học gọi là “fishing expedition” (một chuyến đi câu cá). Tất nhiên, một kết quả như thế không có giá trị khoa học và không thể tin được. (Với 16 thử nghiệm khác nhau và với p = 0.05, xác suất mà một thử nghiệm có kết quả “significant” lên đến 55%, do đó chúng ta chẳng ngạc nhiên khi thấy có một “con cá” được bắt!)
Để cho kết quả trị số P có ý nghĩa nguyên thủy của nó trong bối cảnh thử nghiệm nhiều giả thuyết, các nhà nghiên cứu đề nghị sử dụng thuật điều chỉnh Bonferroni (tên của một nhà thống kê học người Ý từng đề nghị cách làm này). Theo đề nghị này, trước khi tiến hành nghiên cứu, nhà nghiên cứu phải xác định rõ giả thuyết nào là chính, và giả thuyết nào là phụ. Ngoài ra, nhà nghiên cứu còn phải đề ra kế hoạch sẽ thử nghiệm bao nhiêu giả thuyết trước khi bắt tay vào phân tích dữ liệu. Chẳng hạn như nếu nhà nghiên cứu có kế hoạch thử nghiệm 20 so sánh và muốn giữ cho trị số p ở 0.05, thì thay vì dựa vào 0.05 là tiêu chuẩn để tuyên bố“significant”, nhà nghiên cứu phải dựa vào tiêu chuẩn 0.0025 (tức lấy 0.05 chia cho 20) để tuyên bố “significant”. Nói cách khác, chỉ khi nào một kết quả có trị số p thấp hơn 0.0025 (hay nói chung là p/n) thì nhà nghiên cứu mới có “quyền” tuyên bố kết quả đó có ý nghĩa thống kê.

Trị số P, dù cực kì thông dụng trong nghiên cứu khoa học, không phải là một phán xét cuối cùng của một công trình nghiên cứu hay một giả thuyết. Thế nhưng trong thực tế, các nhà khoa học đã quá lệ thuộc vào trị số P để suy luận trong nghiên cứu và tuyên bố những khám phá mà sau này được chứng minh là sai lầm. Có thể nói không ngoa rằng chính vì sự lạm dụng và phụ thuộc một cách mù quáng vào trị số P mà khoa học, nhất là y sinh học, đã trở nên nghèo nàn. Hàng ngày chúng ta đọc hay nghe những phát hiện khoa học trái ngược nhau (như lúc thì có nghiên cứu cho thấy cà phê có tác dụng tốt cho sức khỏe, lúc khác có nghiên cứu cho biết cà phê có hại cho sức khỏe; hay lúc thì thuốc giảm đau aspirin có hiệu năng làm giảm nguy cơ ung thư, nhưng mới đây có nghiên cứu cho thấy aspirin có thể làm tăng nguy cơ bị ung thư vú, v.v…). Có khi công chúng không biết phát hiện nào là thực và phát hiện nào là “dương tính giả”. Theo phân tích của Berger và Sellke, khoảng 25% các phát hiện với “p < 0.05” là các phát hiện dương tính giả [2].

Do đó, chúng ta không nên quá phụ thuộc vào trị số P. Không phải cứ nghiên cứu nào với p<0.05 là thành công và p>0.05 là thất bại. Có khi một phát hiện với p>0.05 nhưng lại là một phát hiện có ý nghĩa. Vấn đề quan trọng là làm sao để ước tính mức độ khả dĩ của một giả thuyết một khi có dữ kiện thật trong tay, tức là ước tính P(H+ | D). Để ước tính P(H+ | D), chúng ta phải áp dụng Định lí Bayes.


Soạn lại: TBT
Nguồn: NVT.com

Các phép tính đơn giản ứng dụng trong SPSS - Lệnh Compute

Xin nhắc lại đây là những bài viết ở mức độ hướng dẫn cơ bản và mang tính chất cá nhân nên không thể tránh sai sót.
Chỉ là mang tính chất xây dựng nguồn tài liệu của YTCC Huế

Chủ đề hôm nay là thực hiện các phép tính cơ bản:
Đơn giản muốn tính BMI trong SPSS. Bạn làm thế nào, trong khi đã có dữ kiện là Cân nặng, chiều cao (cm).

BMI = (Cân nặng/(Chiều cao* chiều cao)*10000)

Mô tả bằng hình ảnh trong SPSS.
H1:
 H2
Bạn trở lại cửa sổ Variable View sẽ thấy 1 biến mới "BMI" xuất hiện. Nó là kết quả của việc thực hiện thuât toán trên.
Xin lỗi là công thức trên thiếu 1 dấu ")" cuối cùng trong hình 2.
Thks đã đọc

TBT
Ytcchue.blogspot.com

Hướng dẫn phân tích số liệu SPSS - YTCC Huế - Phần 2: Xử lý câu hỏi nhiều lựa chọn

Đang viết lại

Thứ Sáu, 3 tháng 12, 2010

Y tế dự phòng: rất quan trọng đối với Việt Nam

Sáng thứ 7 ăn sang, café đứa bạn lang thang internet làm bài tập tiện thể ghé trang nhà NVT đọc lại bài cũ thấy tiêu đề “Y tế dự phòng: rất quan trọng đối với Việt Nam”. Còn nhớ cái ngày thi đại học hay trong suy nghĩ những sinh vien chuyên ngành này vẫn mong ước cái ảo vọng học xong để có thể học tiếp Bác sỹ. Thật buồn, phải chăng ngay trong thế hệ trẻ chúng ta không có một sự thay đổi nào sao?

Xin trích nguyên bài viết của vị GS này:

Trước tình hình phát triển kinh tế nhanh chóng đã và đang diễn ra trong vòng một thập niên trở lại đây, và nước ta không còn xếp vào nhóm các nước nghèo khó nữa, chúng ta có xu hướng quên rằng tình hình y tế và sức khỏe người dân ở nước ta vẫn ở trong tình trạng của một nước nghèo. Thật vậy, thực trạng về bệnh tiêu chảy cấp tính, bệnh tả, cúm gia cầm, SARS, v.v… trong thời gian gần đây là những nhắc nhở rằng nước ta vẫn còn đang đương đầu với những bệnh nhiệt đới, những vấn nạn của các nước nghèo. Trong tình hình như thế, hơn lúc nào hết, nước ta cần một mạng lưới y tế cộng đồng tốt để phòng bệnh từ cấp cơ sở.
Mỗi lần đọc một bản tin về một ca giải phẫu lớn được thực hiện thành công ở nước ta, tôi vừa mừng vừa lo. Mừng là vì giới y khoa nước ta chứng tỏ cho thế giới biết rằng chúng ta không thua kém bất cứ ai về mặt kĩ năng phẫu thuật. Nhưng lo là vì tôi sợ những thành công mang tính đơn lẻ như thế làm cho chúng ta sao lãng một “bức tranh” lớn hơn và nghiêm trọng hơn: sức khỏe cộng đồng. Nhìn qua bức tranh sức khỏe cộng đồng tôi cho rằng Nhà nước phải tập trung đầu tư vào việc phát triển hệ thống y tế cộng đồng hay y tế dự phòng thay vì tập trung vào các thiết bị y khoa đắt tiền.
Bức tranh sức khỏe Việt Nam
Hãy nhìn vào bức tranh y tế nước ta cho kĩ! Thống kê chính thức của Bộ Y tế cho thấy các bệnh sau đây nằm trong hàng “top 10” ở nước ta: các bệnh viêm phổi, viêm họng và viêm Amidan cấp, viêm phế quản và viêm tiểu phế quản cấp, tiêu chảy, viêm dạ dày, ruột non có nguồn gốc nhiễm khuẩn, cúm, sốt rét, tai nạn giao thông, và các bệnh đường hô hấp.
Vẫn theo thống kê của Bộ Y tế, những nguyên nhân tử vong hàng đầu ở nước ta (theo thứ tự) là: các bệnh viêm phổi, các bệnh liên quan đến hệ thống hô hấp (kẻ cả lao), thai chậm phát triển, tai nạn giao thông, suy dinh dưỡng, rối loạn gắn liền với thai nghén và cân nặng không đủ khi sinh, và các tổn thương hô hấp đặc hiệu khác của thời kì chu sinh.
Bức tranh sức khỏe trên cho chúng ta thấy rằng các bệnh viêm và nhiễm trùng, suy dinh dưỡng, và tai nạn giao thông là những bệnh dân ta thường hay mắc và cũng chính là những “tử thần” nguy hiểm nhất hiện nay.
Cái mẫu số chung của các bệnh này là chúng liên quan đến sự nghèo nàn. Hãy lấy suy dinh dưỡng ở trẻ em làm ví dụ. Ngoài các nguyên nhân sinh học và lâm sàng, đứng trên quan điểm của y tế cộng đồng, nguyên nhân chính của suy dinh dưỡng -- như tên gọi rất chính xác -- là thiếu ăn. Thiếu ăn là do nghèo và hoàn cảnh kinh tế gia đình khó khăn. Trong khi nền kinh tế nước ta phát triển nhanh, một bộ phận dân số -- nhất là những người sống trong vùng nông thôn hay vùng xa -- vẫn chưa đủ ăn (và chưa đủ mặc). Theo kết quả nghiên cứu ở Đồng Nai mà tôi vừa đề cập trên, phần lớn (76%) trẻ em suy dinh dưỡng là những em có cha mẹ là nông dân hay làm thuê. Gia đình càng có nhiều con, tỉ lệ suy dinh dưỡng càng cao.
Một đặc điểm chung của những bệnh hàng đầu hiện nay ở nước ta là chúng rất phổ biến. Chẳng hạn như suy dinh dưỡng, có báo cáo cho thấy cứ 5 trẻ em ở nước ta thì có 1 em suy dinh dưỡng (theo một thống kê trong hội nghị tổng kết đánh giá các hoạt động dinh dưỡng năm 2007 do Bộ Y tế và Viện Dinh dưỡng quốc gia tổ chức vào đầu năm nay). Hay như bệnh viêm phổi (là nguyên nhân tử vong số 1), mỗi năm có đến khoảng 360.000 người mắc. Hay như hút thuốc lá, có nghiên cứu cho thấy khoảng 73% đàn ông và thanh niên (tuổi từ 18 trở lên) hút thuốc lá. Đây là một tỉ lệ cao nhất thế giới mà các nhà nghiên cứu Việt-Mĩ đã ghi nhận. Cao hơn cả Trung Quốc và Nhật! Nếu tính theo dân số hiện hành, nước ta có 18,24 triệu thanh niên và đàn ông trên 20 tuổi hút thuốc lá!
Người viết bài này ước tính rằng mỗi năm có khoảng 11.500 thanh niên và đàn ông trên 20 tuổi mắc bệnh ung thư phổi; trong số này 85% (hay 9.800 trường hợp) là có liên quan đến hút thuốc lá. Hút thuốc lá cũng là yếu tố nguy cơ có liên quan đến 85% trường hợp ung thư họng, nhưng số lượng bệnh nhân ít hơn ung thư phổi. Chi phí liên quan đến thuốc lá (chỉ tính chi phí điều trị trong bệnh viện) là khoảng 78 triệu USD (thời giá 2005).
Nhu cầu cho một hệ thống y tế dự phòng
Tư duy y khoa truyền thống thường quan tâm đến việc đáp ứng nhu cầu của bệnh nhân. Tư duy này hun đúc thành những qui định về y đức như có trách nhiệm với cá nhân người bệnh, và các cơ sở vật chất y tế thường được thiết kế để đáp ứng nhu cầu của người bệnh. Ngay cả nghiên cứu y khoa cũng chịu ảnh hưởng bởi tư duy này, vì một nghiên cứu y khoa cổ điển thường bắt đầu với câu hỏi “tại sao bệnh nhân mắc bệnh”.
Ngày nay, chúng ta biết rằng nếu hệ thống y tế chỉ để đáp ứng nhu cầu của bệnh nhân thì vẫn chưa đủ. Do đó, tư duy y khoa truyền thống này đã được khai triển thành một bước cao hơn và qui mô hơn: đó là phòng bệnh và nhận dạng những nhóm người có nguy cơ mắc bệnh cao. Nói cách khác, đây chính là tư duy y tế dự phòng. Thật ra, tư duy này không mới đối với người Việt, vì Việt Nam ta vẫn có câu “phòng bệnh hơn chữa bệnh”.
Tư duy y khoa truyền thống đặt trọng tâm vào việc điều trị và chữa bệnh, còn tư duy y tế dự phòng đặt trọng tâm vào việc phòng bệnh. Đối tượng của tư duy y khoa truyền thống là cá nhân người bệnh, còn đối tượng của tư duy y khoa dự phòng là cộng đồng. Đối với y khoa truyền thống, một cá nhân hoặc là có hay không có bệnh (do đó, có người ví von rằng y khoa cổ điển chỉ biết đếm từ 0 đến 1), nhưng y tế dự phòng quan tâm đến nguy cơ mắc bệnh của một quần thể (và nguy cơ này có thể dao động từ thấp, trung bình, đến cao). Do đó, chỉ số để đánh giá hiệu quả lâm sàng của y khoa cổ điển là sự thành công trong việc cứu một bệnh nhân, nhưng chỉ số lâm sàng của y tế dự phòng là giảm thiểu nguy cơ mắc bệnh của một cộng đồng và kéo dài tuổi thọ cho một dân số.
Y tế dự phòng không chỉ quan tâm đến các bệnh truyền nhiễm hay suy dinh dưỡng, mà còn liên quan trực tiếp đến các bệnh mãn tính như tim mạch, viêm khớp xương, đái tháo đường, cao huyết áp, tai biến, loãng xương, ung thư, v.v… Y tế dự phòng quan niệm rằng sự phát sinh các bệnh mãn tính là hệ quả của một quá trình tích lũy những rối loạn sinh lí qua phơi nhiễm các yếu tố nguy cơ. Do đó, can thiệp vào các yếu tố nguy cơ sẽ làm giảm nguy cơ mắc bệnh ở qui mô cộng đồng.
Các yếu tố nguy cơ này có thể chia thành 2 nhóm: nhóm có thể can thiệp được và nhóm không thể can thiệp được. Các yếu tố không có thể can thiệp được như tuổi tác và di truyền. Nhưng các yếu tố có thể can thiệp được như dinh dưỡng, vận động thể lực, lối sống (hút thuốc lá, thói quen rượu bia), môi trường sống (như nước, không khí, phương tiện đi lại), v.v… Từ đó, các chiến lược y tế dự phòng là làm thay đổi các yếu tố có thể can thiệp được để nâng cao chất lượng sống cho cộng đồng.
Vì thế, thành công của một chiến lược y tế dự phòng có thể đem lại lợi ích và hiệu quả cao hơn là thành công trong việc đáp ứng nhu cầu của người bệnh. Chẳng hạn như một nghiên cứu mới công bố vào tháng 11 năm ngoái cho thấy rằng chỉ cần 50-70% dân số trong những vùng bị dịch tả (hay có nguy cơ cao, như các tỉnh phía Bắc hiện nay) uống vắcxin 2 lần một năm, và với hiệu quả như vừa mô tả, số ca bệnh tả có thể giảm đến 90%.
Vấn đề đầu tư
Nhận thức được vai trò quan trọng của y tế dự phòng, ở các nước tiên tiến đều thiết lập mạng lưới y tế cộng đồng đến từng phường và các vùng xa thành phố. Chẳng hạn như ở Úc, các bà mẹ trước và sau khi sinh con đều được tầm soát và kiểm tra sức khỏe ở các trạm y tế dự phòng này. Ngoài ra, các dịch vụ về phòng chống bệnh ở qui mô cộng đồng như tiêm chủng ngừa, tuyên truyền và giáo dục y tế cộng đồng, v.v… đều được thực hiện bởi các cán bộ y tế dự phòng.
Nhưng một điều đáng buồn ở nước ta ngày nay là y tế dự phòng không được đánh giá đúng mức. Thật là sốc khi nghe có quan chức chính quyền nói rằng không cần đến y tế xã. Có thể nói đó là một phát biểu vô trách nhiệm nhất. Muốn xây nhà cho vững thì phải có nền móng cho chắc; muốn có một nền y tế quốc gia hữu hiệu thì phải bắt đầu bằng hệ thống y tế cơ sở tốt.
Nhưng trong thực tế, chi tiêu của Nhà nước cho y tế chỉ chiếm 6,1% tổng số chi tiêu của Nhà nước. Tỉ lệ này thấp nhất so với các nước láng giềng như Campuchea (16%), Lào (khoảng 7%), Mã Lai (6,5%), Trung Quốc (10%), và Nhật (16.4%). Do đó, không ngạc nhiên khi thấy cơ sở vật chất của hệ thống y tế ở nước ta đã ở trong tình trạng quá tải từ hơn một thập niên qua. Thật vậy, theo thống kê của Bộ Y tế, năm 1997 cả nước có khoảng 198 ngàn giường bệnh, nhưng đến năm 2005, con số này giảm xuống còn 197 ngàn! Trong khi đó dân số tiếp tục gia tăng, và hệ quả là số giường bệnh tính trên 10.000 dân số giảm từ 26,6 năm 1997 xuống còn 23,7 năm 2005.
Thật ra phải nói là “khủng hoảng” thì mới đúng, vì ở bất cứ tỉnh thành hay địa phương nào, công suất giường bệnh tại các bệnh viện đều trên 100%. Tình trạng hai hay ba bệnh nhân cùng nằm một giường, hay phải nằm dưới sàn hay ghế bố, phổ biến đến nỗi các bác sĩ xem đó là chuyện bình thường! Đứng trên bình diện vĩ mô, nguyên nhân chính của tình trạng này là do cơ sở vật y tế dự phòng còn quá kém, cho nên bệnh nhân “vượt tuyến” đến các bệnh viện lớn.
Mục tiêu tối hậu của bất cứ hệ thống y tế nào là nâng cao sức khỏe và kéo dài tuổi thọ cho người dân. Ngày nay, người ta nói đến “xã hội hóa” y tế, nhưng thực tế là đùn đẩy chi tiêu y tế về cho người dân. Bệnh viện và các công trình phúc lợi xã hội (như trường học và đại học) là hiện thân, là thể hiện sự quan tâm của một chính phủ đến sự an sinh của người dân. Nhà nước cần phải tăng đầu tư cho ngành y tế dự phòng, và qua đó tạo điều kiện sao cho người nghèo có thể được điều trị như mọi thành phần khác trong xã hội, và từng bước nâng cao công bằng xã hội. Bài toán y tế ở nước ta chính là xây dựng hệ thống y tế dự phòng, chứ phải nên tập trung ngân sách vào những thiết bị đắt tiền mà đại đa số người dân không hưởng lợi ích gì từ những đầu tư như thế.
Thành công một ca giải phẫu có thể cứu sống một mạng người, nhưng thành công trong một chiến lược y tế dự phòng có thể cứu sống nhiều triệu người, và kéo dài tuổi thọ cũng như nâng cao chất lượng sống cho cả một dân tộc. Nhưng trớ trêu thay, trong khi người bác sĩ thành công một ca giải phẫu chắc chắn sẽ được báo chí nhắc đến như là một anh hùng, những người vạch định và thực hiện thành công một chiến lược y tế dự phòng là những người “trầm lặng” chẳng ai để ý đến! Đã đến lúc xã hội phải ghi nhận đúng đắn những đóng góp âm thầm của các nhà y tế dự phòng. 
Trích bài: http://tuanvannguyen.blogspot.com/2008/04/y-t-d-phng-rt-quan-trng-i-vi-vit-nam.html

 

 


Tìm kiếm nội dung trong blog

Đã xảy ra lỗi trong tiện ích này