Xác suất và Khả năng khác nhau ở điểm nào?
[Trả lời bởi: Dima Korolev, trưởng phòng Machine Learning tại FriendlyData, trả lời ngày 15/06/2015
Link bài viết gốc: https://qr.ae/pNYtfD
Dịch: Bùi Thanh Lâm]
#math
Hiểu nôm na rằng, xác suất (NV: probability) là một đại lượng được chuẩn hóa để có tổng bằng 1, một cách tự nhiên hoặc được xây dựng theo công thức. Xác suất là xác định theo một phân bố.
Khả năng (NV: likelihood) cũng được dùng để định lượng về độ chắc chắn sẽ xảy một sự kiện nào đó. Tuy nhiên, nó không xác định bởi hàm phân phối, mà theo quan sát từ sự kiện đã xảy ra.
—
Giả dụ bạn có một đồng xu. (100*p) % cơ hội sẽ cho ra mặt ngửa, (100* (1-p)) % mặt sấp.
Nếu bạn tung nó 3 lần liên tiếp, số lần xuất hiện mặt ngửa sẽ được đại diện bởi các con số như sau, theo Phân phối Nhị thức:
3 lần: p^3
2 lần: 3.p^2.(1-p)
1 lần: 3.p.(1-p)^2
0 lần: (1-p)^3
Tổng của 4 số ở vế phải, theo định nghĩa, phải bằng 1. Đó là bởi Phân phối Nhị thức là một phân phối xác suất. Do đó, tổng của các con số đại diện cho tất cả các trường hợp có thể xảy ra phải bằng 1, và mỗi số không thể âm. Con số đó chính là Xác suất của sự kiện.
—
Tiếp nhé:
Tôi quan sát được có 2 lần mặt ngửa trong 3 lần tung đồng xu.
Như vậy kết luận được gì về p?
- Việc tôi quan sát được 2 lần ngửa không nói lên điều gì về p, ngoại trừ p là một số nằm trong khoảng từ 0 đến 1.
- Tuy nhiên, có một giá trị nào đó mà khả năng cao là giá trị thực sự của p. Chẳng hạn, p có khả năng cao nhất nhận giá trị bằng 2/3.
Xuất hiện từ “khả năng” đúng không? Đây cũng là ý tưởng xuất phát cho thuật ngữ Khả năng.
Làm thế nào để biết được p có khả năng nhận giá trị nào cao hơn?
Thử so sánh theo từng cặp nhé:
- p=0.02 có khả năng cao hơn p=0.01? Tất nhiên, vì nó gần với giá trị 2/3 mà chúng ta quan sát được hơn.
- p=0.98 có khả năng cao hơn p=0.00? Tất nhiên, vì nó cũng gần với giá trị 2/3 mà chúng ta quan sát được hơn.
- Vậy nếu phân vân giữa p=0.66 và 0.67 thì sao? Ta sẽ tính giá trị của biểu thức 3.p^2.(1-p) với từng trường hợp.
- Với p=0.66, kết quả: 0.444312
- Với p=0.67, kết quả: 0.444411
- Như vậy, p=0.67 có khả năng cao hơn p=0.66
Nếu ta lấy tích phân của 3.p^2.(1-p) cận từ 0 đến 1, kết quả sẽ không phải 1. Sẽ ra một số lớn hơn.
Vậy thông số này không phải là xác suất.
Nhưng nó vẫn có thể giúp ta đánh giá được sự kiện nào có khả năng cao hơn. Vì thế ta gọi nó là Khả năng (likelihood).
Nếu ta chuẩn hóa thông số này theo một tham số nào đó (trường hợp này là hàm beta), ta sẽ được một phân phối nào đó (trong trường hợp này là Phân phối Beta, một phân phối tiên nghiệm liên hợp (NV: conjugate prior) với Phân phối Nhị thức).
—
Bình luận, Fan Jiang, 16/10/2018:
Giải thích rất tốt! Tuy nhiên tích phân của 3.p^2.(1-p) cận từ 0 đến 1, kết quả bằng 0.25 nhé.
—
ND: Câu trả lời đúng trọng tâm, nhưng chưa rõ ràng. Dưới đây là một video của StatQuest giải thích rõ hơn về vấn đề này:
https://youtu.be/pYxNSUDSFH4
Trong ví dụ trên, probability là các giá trị biểu thị khả năng xảy ra 0, 1, 2, 3 mặt ngửa nếu biết p (phân phối nhị thức đã biết tham số p).
Còn likelihood là giá trị biểu thị khả năng p bằng một số nào đó nếu quan sát được 2 trong 3 lần là mặt ngửa (phân phối nhị thức nhưng chưa biết tham số p).
Khái niệm likelihood được sử dụng rất nhiều, đặc biệt là trong ước lượng hợp lý cực đại (max likelihood estimation).
StatQuest là một kênh Youtube rất hay về xác suất thống kê, học máy. Ở mỗi video, Josh Starmer luôn có một bài hát với tiếng ukulele rất vui nhộn.