Xin thứ lỗi cho tôi vì đã hỏi ngu, nhưng tôi là một thầy thuốc – người phải thẩm định thường xuyên để quyết định xem nên dùng loại thuốc nào điều trị cho bệnh nhân. Toán không phải là thế mạnh của tôi và thực sự tôi đã mất một khoảng thời gian khó khăn để hiểu được giá trị p-value là gì. Ở trường dược, chúng tôi chỉ được dạy một cách nhanh nhất, tóm lược nhất, tức là, p-value là xác suất mà kết quả giống như là do sự ngẫu nhiên diễn ra. Nếu < 0.05, đó không có ý nghĩa về mặt thống kê, tức là không có sự khác biệt/đừng dùng kết quả đó, thế đối với tôi thì lại đơn giản hoá quá mức p-value rồi, dù nó thường được coi là bát thánh trong khi thảo luận. Tôi rất biết ơn nếu ai đó có thể giải thích đơn giản cho người không chuyên, cho tôi hiểu về ý tưởng phía sau của p-value là gì và như thế nào thì cần tìm giá trị p-value và coi nó là kết quả phù hợp.
_____________________
Đây không phải là một câu hỏi ngu đâu – thật tuyệt khi bạn muốn đi sâu hơn cách dùng xàm (và có khả năng cao là hiểu sai) của “ý nghĩa” thống kê.
Định nghĩa của p-value bạn nhắc đến ở trên là sai. p-value không phải là xác suất xảy ra sự việc ngẫu nhiên, đó là xác suất quan sát được giả thiết mà bạn thực hiện (ví dụ như t-score [T/N: đo mật độ xương]), hoặc một giá trị cực trị của giả thiết đó, dưới giả thiết rằng giả thuyết không là đúng edit: VÀ tất cả giả thiết mô hình đều đúng (ví dụ: nếu các quan sát không độc lập, sai số không chuẩn hoặc thuần nhất, v.v., mô hình cần được quan tâm, v.v.) Ví dụ, nếu một buổi thí nghiệm hiệu quả thuốc, giả thuyết không có thể là “không có cải thiện so với giả dược”.
p-value đặc biệt không theo trực giác và nếu đứng riêng lẻ thì không có ý nghĩa; nó cần được đặt vào văn cảnh (ví dụ, lượng thuốc khiến kết quả thay đổi).
Về cơ bản, thứ bạn cần tìm là phép thử kia có hiệu quả khi áp dụng vào thực tế, khác biệt về mặt lâm sàng, và liệu giá trị p-value có đủ nhỏ để bạn có thể thoải mái với sai số hay không.
Có thể hiểu p-value một cách đơn giản bằng cách lấy logarith cơ số 2 để thu được giá trị gọi là S-value, hay surprisal [ngạc nhiên]. Một cáchh trực quan, trong thí nghiệm tung đồng xu, ở đó S-value là số lần liên tiếp mặt ngửa bạn thấy được khi tung một đồng xu cân bằng. Vì vậy, p-value của 0.05 tương đương với S-value là 4, hay được 4 mặt ngửa liên tiếp với một đồng xu cân bằng (nói cách khác, không quá bất ngờ). p-value 0.005 tương đương với việc 8 lần ngửa liên tiếp. Khá bất ngờ đấy, nhưng cũng không đến mức không thể xảy ra. Xuống tới mức p-value 0.00001 và ta gần như tung 17 mặt ngửa liên tiếp.
Tôi không miêu tả được p-value những lúc quan trọng do không quen với các tiêu chuẩn bên dược, nhưng cho dù ngưỡng bạn chọn như thế nào, bạn cũng cần quan tâm đến rủi ro khi quyết định sai. Trong trường hợp không có bằng chứng đầy đủ, ta có thể chia ra một số trường hợp và sẽ có sự chủ quan trong đó.
Đây là một chủ đề nói không bao giờ hết mất, nhưng tôi nghĩ đó ít nhất là điểm bắt đầu cho bạn. Nếu cần đọc thêm, tham khảo đây nhé:
https://lesslikely.com/statistics/s-values/
_____________________
u/JerkJenkins (20 points)
Kể cả các nhà khoa học vẫn nhầm p-value cơ mà. Nhiều lắm. Bài báo này [https://fivethirtyeight.com/…/not-even-scientists-can…/] từ 538 lời giải thích về p-value mà không mang nhiều tính lý thuyết.
_____________________
u/backgammon_no (15 points)
Tôi làm thống kê y học ở một bệnh viện và cái tiêu đề của bạn gần như là phân nửa công việc của tôi vậy.
Điều tốt nhất bạn có thể làm cho bệnh nhân của mình là trở thành bạn của những thống kê thực. Chẳng ai biết tất cả mọi thứ, và tự dạy thống kê cho bản thân sẽ là một chặng đường dài, khó khăn và đâu đó là sai lầm. Nếu bạn là một bác sĩ, những sai sót thông thường có thể nguy hiểm đến tính mạng con người đó.
Tôi thường làm việc với các bác sĩ để đánh giá việc điều trị. Việc này rất hiệu quả, họ dùng các kiến thức họ có về thuốc để thu hẹp lại các trường hợp có thể có, và tôi dùng kiến thức thống kê để kiểm tra các trường hợp đó.
Nghe có vẻ kì, nhưng tôi khuyến khích bạn đừng cố học làm gì cả. Thống kê là ngành khoa học cần đủ lông đủ cánh theo cách của riêng nó để hiểu hết và bạn có vẻ như không có nhiều thời gian để học tốt phần này.