Một khái niệm thống kê dễ hiểu nhưng chóng quên
Tác giả: Ines Lee, 19 hours ago, 8 min read
_____________
Có lẽ chúng ta đã nghe tới một vài lập luận này, liệu bạn có thể chỉ ra sai lầm trong những ý kiến dưới đây?
Một giáo viên than thở rằng khi ông ấy khen ngợi những học sinh giỏi, vào lần kế tiếp chúng sẽ làm bài tệ hơn, còn khi mà ông phạt những học sinh kém, thì ở lần làm bài kế tiếp, chúng sẽ làm bài tốt hơn. Do đó việc áp dụng hình phạt tốt hơn so với việc khen ngợi.
Hay một vận động viên khen ngợi thứ nước tỏi ngâm mà cô ta sử dụng hôm qua để làm giảm cơn đau bàn chân của mình, thứ đã giúp đôi bàn chân của cô cảm thấy tốt hơn. Cô ta cho rằng loại nước tỏi ngâm đó thực sự hiệu nghiệm và kỳ diệu.
Một nhà phê bình phim cho rằng khi thắng giải thưởng ở Viện Hàn lâm, một giải thưởng danh giá, điều này sẽ làm sự nghiệp diễn xuất của một diễn viên đi xuống chứ không hề đi lên.
Có rất nhiều nghi vấn cho những phát biểu trên. Chắc hẳn rồi, làm sao một thứ nước tỏi ngâm đơn giản lại có thể chữa cơn đau chân cơ chứ. Bài viết này sẽ chỉ ra những điều trên thực sự có vấn đề thông qua khái niệm hồi quy về giá trị trung bình, và đưa ra những gợi ý để tránh không mắc những lỗi này.
HỒI QUY VỀ GIÁ TRỊ TRUNG BÌNH
Hãy nhìn lại điểm chung ở những điều đã xảy ra ở ba phát biểu trên, cả ba vấn đề này đều là những trường hợp “cá biệt”(tích cực hoặc tiêu cực). Chúng ta thường quan sát sự kiện xảy ra như sau(cá biệt, bình thường, bình thường, cá biệt…), điều này có thể giải thích bằng hồi quy về giá trị trung bình hay “quay ngược lại sự tầm thường”. Hồi quy về giá trị trung bình đề cập đến ý tưởng rằng các sự kiện hiếm khi xảy ra thường được theo sau bởi một sự kiện bình thường hơn. Theo thời gian, các kết quả này sẽ hồi quy tại điểm giá trị trung bình.
Khái niệm trên được đề xuất bởi Sir Francis Galton khi ông nhận ra những cặp bố mẹ có chiều cao cao hơn trung bình sẽ có con thấp hơn họ một chút, trong khi ngược lại, bố mẹ có chiều cao thấp sẽ có con cao hơn họ một chút. Một cách trực quan hơn, nếu chúng ta vẽ biểu đồ có trung tung là chiều cao của bố mẹ, trục hoành là chiều cao của con cái, sau đó kẻ đường hồi quy qua các điểm thì sẽ được đường thẳng có hệ số góc nhỏ hơn 1.
Ý tưởng trên không chỉ đúng với mối liên hệ giữa chiều cao của bố mẹ và con cái, mà hiện tượng này xảy ra ở khắp mọi nơi. Ví dụ như khi chúng ta quay lại một quán ăn mà có món ăn rất ngon chúng ta đã thử lần đầu, ta thường cảm thấy lần này không ngon bằng lần trước.
Một ví dụ khác ở khía cạnh xác suất giải thích hiện tượng này đó là khả năng nhận được mặt ngửa hoặc sấp liên tục trong nhiều lần khi tung đồng xu rất khó xảy ra. Có nhiều nguyên nhân khiến việc một món ăn trở nên kém hấp dẫn trong lần thử tiếp theo như chất lượng đồ ăn, quán ăn có đông hay không, thái độ nhân viên phục vụ hay là tâm trạng của bạn ngày hôm đó, rất khó để những thứ như vậy xảy ra chính xác trong lần này.
SỰ NGỤY BIỆN
Quy luật trong thống kê cho rằng bất cứ khi nào tương quan giữa hai biến là không hoàn hảo, chúng sẽ có xu hướng hồi quy về giá trị trung bình. Nhưng điều này thì sao?
Hồi quy về giá trị trung bình là một thứ dễ hiểu nhưng cũng khiến chúng ta nhanh quên nó. Bởi vì các hiện tượng thường xảy ra theo trình tự(cá biệt, bình thường, cá biệt, bình thường..), não chúng ta thường có xu hướng vẽ lên mối quan hệ hai hiện tượng này. Chúng ta cho rằng các hiện tượng cá biệt đó dẫn tới những hiện tượng tầm thường(thắng giải Oscar xong thì diễn xuất tệ hơn).
Nói tóm lại, khi quên mất quy luật hồi quy về trung bình., ta thường đi tới kết luận sự việc xảy ra bởi các nguyên nhân cụ thể, trong khi sự thật là những điều này thường chắc chắn xảy ra bất kể nguyên nhân nào. Nói cách khác, các hiện tượng bình thường vẫn sẽ xảy ra dù chúng ta loại bỏ những hiện tượng cá biệt xảy ra trước đó.
Cùng quay lại với 3 ý kiến ban đầu, liệu rằng chúng ta có thể rút ra được điều gì bằng cách sử dụng hồi quy về giá trị trung bình?
Người giáo viên cho rằng khen thưởng học sinh sẽ khiến kết quả trở nên tệ hơn vào lần kế tiếp. Nhưng nếu xem xét kỹ hơn, chúng ta có thể nhận thấy giáo viên này đã quá tin vào hệ thống thưởng/phạt của mình.
Như Danniel Kahneman đã lưu ý trong cuốn sách ‘Suy nghĩ, nhanh và chậm”, thành công = tài năng + may mắn. Thành phần may mắn trong phương trình này khiến cho việc thành công liên tục trở nên khó khăn hơn rất nhiều dù bạn có rất nhiều tài năng(hay không có). Vì may mắn là đại lượng ngẫu nhiên, nên đôi khi dù bạn không học tốt, nếu đủ may mắn vẫn sẽ có được kết quả học tập khả quan.
Phương trình ‘thành công = tài năng + may mắn” khiến phần lớn các trường hợp sẽ hồi quy về một mức nào đó. Kết quả học tập kỳ này bết bát sẽ dẫn tới một kết quả học tập tốt hơn ở kỳ tới, bất kể có bị phạt hay không(nếu đủ may mắn), hay kết quả học tập tốt ở kỳ trước có thể dẫn tới việc học tập có thể thấp hơn ở kỳ này(nếu không đủ may mắn). Hệ thống thưởng/phạt có thể chẳng hiệu nghiệm như người giáo viên nghĩ.
Người vận động viên cho rằng nước ngâm tỏi giúp chân cô ta đỡ đau hơn. Giả sử rằng ngày hôm nay chân cô cực kỳ đau, cô cố mọi cách để làm cho bớt đau lại, trong đó có cách ngâm chân vào thứ nước tỏi kỳ diệu đó ngày trước khi đi ngủ. Sáng hôm sau cô tỉnh dậy với đôi bàn chân đỡ đau hơn, có thể thứ nước đó đã có công dụng. Tuy nhiên hồi quy về giá trị trung bình cho chúng ta thấy được sự hợp lý hơn. Bởi vì cơn đau về mặt thể chất thường theo chu kỳ tự nhiên, theo sau một ngày đau đớn thường là một ngày ít đau đớn hơn, cơn đau có thể biến mất nhờ vào chu kỳ vốn có của nó.
Khi quan sát các sự kiện cá biệt, chúng ta thường quên mất sự kiện đó hiếm gặp như thế nào. Và khi theo sau những sự kiện cá biệt đó là những sự kiện bình thường, ta thường cố giải thích tại sao những điều bình thường đó lại xảy ra mà quên mất những điều bình thường đó thực sự ‘bình thường”. Để tránh những lỗi ngụy biện như thế này, đầu tiên chúng ta tránh dùng những sự kiện đã xảy ra trước đó để giải thích cho một sự kiện. Sau đó chúng ta nên tự hỏi những câu hỏi sau
1. Liệu có điều gì đó khác thường với vấn đề này hay đó là điều mà bạn kỳ vọng xảy ra?
2. Liệu có những sự kiện cá biệt nào xảy ra trước đó làm sự kiện bình thường này trở nên khác thường hay không?
3. Liệu sự kiện bình thường này vẫn sẽ xảy ra khi bạn loại bỏ sự kiện xảy ra trước đó?
Câu hỏi thứ nhất giúp chúng ta xem xét tới khả năng xảy ra của một sự kiện thông thường. Câu hỏi thứ hai giúp chúng ta nghĩ về mối liên quan giữa kết quả xảy ra thay vì quan sát đơn lẻ. Câu hỏi thứ ba giúp chúng ta nghĩ tới những khả năng không xảy ra. Bằng cách tự hỏi bản thân ba câu hỏi trên, chúng ta sẽ tránh những suy nghĩ sai lầm về các vấn đề, con người hay hệ thống.