Lý thuyết trò chơi là gì?

Lý thuyết trò chơi chỉ đơn giản là cách mà chúng ta biến một vài những quyết định khó khăn trở thành những bài toán phức tạp.
Giả sử chúng ta chơi một trò chơi, và tôi sẽ đưa cho bạn hai chiếc bánh quy nếu bạn nói từ “đỏ”, và ba chiếc nếu bạn nói từ “xanh”. Bạn sẽ làm gì?
Rõ ràng là bạn sẽ nói từ “xanh” rồi, phải không? Vì có nhiều bánh quy hơn mà!
Đó chỉ là một trò chơi đơn giản. Nhưng chúng ta có thể áp dụng nó cho rất nhiều tình huống. Giả sử bạn đang nghĩ liệu mình nên xem Teletubbies hay là Sesame Street. Giả sử bạn suy nghĩ thế này: “Xem Teletubbies cũng vui như ăn hai chiếc bánh quy, nhưng xem Sesame Street thì vui như ba cái!” Chỉ bằng cách đưa ra số bánh quy cho hai khả năng, chúng ta đã có thể biến nó thành một trò chơi giống như trước: Rõ ràng là bạn sẽ chọn câu trả lời có ba chiếc bánh rồi.
Hãy thử một trò chơi phức tạp hơn. Lần này tôi sẽ chơi cùng bạn.
Trong trò chơi này, cả hai chúng ta sẽ cùng nhau nói từ “Đỏ” hoặc “Xanh”, nhưng luật chơi sẽ phức tạp hơn một chút. Kiểu như thế này:

  1. Nếu chúng ta cùng nói “Đỏ” thì mỗi người sẽ được một chiếc bánh.
  2. Nếu cùng nói “Xanh” thì số lượng bánh một người có sẽ là hai.
    Trông như chúng sẽ muốn trả lời là “Xanh”, phải không?
    Vậy nếu chúng ta nói khác nhau thì sẽ như thế nào?
    Và chúng ta có luật thứ 3.
  3. Nếu một trong hai người nói “Đỏ”, người còn lại nói “Xanh”, thì người nói “Đỏ” sẽ được 3 chiếc bánh, còn người nói “Xanh” sẽ không nhận được gì cả.
    Và giờ thì mọi thứ phức tạp lên rồi đây. Nếu tôi nói “Xanh” thì bạn sẽ có hai lựa chọn: Bạn có thể nói “Xanh” giống tôi và nhận 2 chiếc bánh (luật 2), hoặc nói “Đỏ” và nhận 3 chiếc về mình (luật 3). Hiển nhiên, “Đỏ” sẽ là lựa chọn tốt hơn nếu tôi chọn “Xanh”. Nhưng điều đó cũng tương tự đối với tôi nếu tôi chọn “Đỏ”: Khi đó lựa chọn của bạn là chọn “Đỏ” giống tôi để nhận 1 chiếc bánh, hoặc là chọn màu còn lại để tay trắng ra về.
    Vì thế, bạn sẽ luôn muốn chọn “Đỏ” bởi vì nó luôn có lợi cho bạn. Nhưng logic tương tự cũng áp dụng được cho tôi. Điều đó có nghĩa rằng nếu chúng ta đều chơi theo cách ích kỉ, chúng ta đều sẽ chọn “Đỏ”, và chỉ nhận một chiếc bánh.
    Nhưng rõ ràng là kết quả sẽ tốt hơn nếu như chúng ta cùng chọn “Xanh”, bởi vì chúng ta sẽ nhận hẳn 2 chiếc bánh quy thơm lừng!
    Rõ ràng là trong thế giới thực, chúng ta có thể cùng nói chuyện với nhau về điều đó, ngoặc tay rồi hứa rằng cả hai sẽ cùng chọn “Xanh”. Hoặc có thể một trong hai chúng ta sẽ tỏ ra tử tế và chọn “Xanh”, mặc dù đáp án tốt nhất sẽ luôn là màu đỏ. Trong lý thuyết trò chơi, chúng ta giả sử rằng mọi người không thể tin tưởng lẫn nhau, đều ích kỉ và muốn tối đa hóa lợi ích về mình.
    Cả hai cùng lựa chọn “Đỏ” là thứ mà chúng ta sẽ gọi là “Cân bằng Nash”. Có đủ mọi thể loại quy tắc toán học để tìm ra Cân bằng Nash là gì, nhưng bạn không cần phải bận tâm. Về cơ bản đó chỉ là những lựa chọn mà mọi người sẽ luôn chọn nếu như họ muốn lấy nhiều bánh quy nhất có thể.
    Cũng giống như trò chơi đơn giản của chúng ta, lý thuyết trò chơi có thể được áp dụng vào thế giới thực. Ví dụ, bạn đang tranh giành một miếng bánh với em trai mình. Nếu cả hai cãi nhau, miếng bánh có thể sẽ bị rơi ra khỏi bàn, và hai anh em sẽ chỉ ăn được phần kem dính trên đầu ngón tay sót lại. Nếu hai anh em đấm nhau và một người thua, rõ ràng là người thắng sẽ giành được bánh, còn người kia sẽ không có gì cả, ngay cả kem. Nếu cả hai đều bỏ cuộc rồi nói chuyện anh em các thứ, cả hai có thể chia đôi chiếc bánh rồi ăn cùng nhau.
    Chúng ta có thể biến điều này thành trò chơi Đỏ/Xanh như trên chỉ bằng cách gán số lượng bánh quy cho các khả năng khác nhau. Nếu kem phủ có giá trị bằng một chiếc bánh quy, một nửa miếng bánh có giá trị bằng hai chiếc bánh quy, và toàn bộ miếng bánh có giá trị bằng ba chiếc, thì nó hoàn toàn giống với trò chơi Đỏ/Xanh của chúng ta. Chọn “Đỏ” giống như đấm nhau giành lấy bánh, còn “Xanh” thì giống như ngồi nói chuyện đàng hoàng.
    Từ trò chơi Đỏ/Xanh và bài toán phức tạp mà chúng ta đã làm để tìm ra “Cân bằng Nash”, chúng ta đều hiểu rằng những người ích kỷ không tin tưởng người khác nên chọn đấm nhau là tốt nhất, bởi vì ăn kem phủ còn hơn không, và một miếng bánh toàn bộ thì ngon hơn là chỉ một nửa. Điều này có nghĩa là họ sẽ luôn có phần. Nhưng, giống như trước, tốt hơn hết là cả hai nên ngồi lại nói chuyện với nhau. Những người trưởng thành nói rằng điều tương tự cũng áp dụng cho các cuộc chạy đua vũ trang như Chiến tranh Lạnh hoặc nhiều chủ đề khác trong cuộc sống.
    Lý thuyết trò chơi sẽ giải quyết những vấn đề như vậy cho các trò chơi ngày càng phức tạp. Bạn có thể thêm nhiều người chơi hơn, làm cho số lượng bánh quy trở nên phức tạp hơn các thứ các thứ. Bạn cũng có thể chơi cùng một trò chơi lặp đi lặp lại, điều này sẽ thay đổi mọi thứ khá nhiều. (Bởi vì việc chia sẻ bánh ngay từ đầu biết đâu lại tốt, và rằng bạn luôn có thể quay lại để dạy dỗ thằng cu em nếu nó vì miếng bánh mà dám bóp thằng anh sml). Tóm lại, lý thuyết trò chơi là một loạt các phép toán và quy tắc giúp bạn tìm ra kết quả của những kiểu trò chơi như vậy sẽ là gì.

Một ví dụ điển hình mà tôi biết gần đây chính là loạt sút luân lưu trong bóng đá.
Trong một trận đấu bắt buộc phải có kết quả, ví dụ như CK World Cup, nếu tỉ số hai đội hòa sau khi thời gian thi đấu chính và cả hiệp phụ kết thúc, loạt sút luân lưu sẽ được tổ chức. Năm cầu thủ, lần lượt từng người bước lên và đặt bóng vào vị trí cách khung thành 11m, lấy đà và sút, trong khi thủ môn sẽ cố gắng để cản phá.
Giờ thì, một phần của loạt sút này sẽ là về kĩ năng giữa hai người chơi, nhưng phần nhiều sẽ liên quan đến lý thuyết trò chơi mà chúng ta đang nói đến. Nếu như thủ môn biết rằng cầu thủ thường sẽ sút vào phía bên trái, anh ta sẽ biết cách để đổ người. Nhưng, cầu thủ sút bóng cũng biết rằng thủ môn đã làm nhiều “bài tập” bắt bóng. Nên anh ta có thể sút góc trái, như thủ môn đã dự tính, hoặc góc phải và thủ môn sẽ không bắt được. Nhưng thủ môn cũng biết rằng đó là lựa chọn của mình, rằng anh ta có thể bất ngờ lao sang phía bên phải. Nhưng cầu thủ sút bóng có thể sẽ đánh lừa thủ môn 2 lần và rồi lại sút trái…. bạn tự hiểu ý tưởng nhé.
Điểm mấu chốt ở đây là, những gì cầu thủ sút phạt đền làm sẽ phu thuộc vào việc thủ môn làm gì. Và ngược lại, những gì thủ môn làm sẽ phụ thuộc vào việc dự đoán cầu thủ sẽ sút bóng ra sao.
Một ví dụ điển hình chính là loạt sút luân lưu trong trận CK Champion’s League 2008 ở Moscow. Các cầu thủ Chelsea (áo xanh) đã được cho biết rằng thủ môn của Man Utd, Edwin van der Sar, thường sẽ đổ người về phía bên yếu hơn của cầu thủ, vì vậy họ nên sút về phía mạnh hơn. Đối với 4 người đầu tiên thì đó là bên phải của họ – chính là bên trái của van der Sar.
Trong khi đó, thủ môn của Chelsea – Petr Cech, biết rằng khi Cristiano Ronaldo (màu áo 7 đỏ), dừng lại trong khi chạy đà, anh ta sẽ thường sút về phía bên trái.
Và mọi chuyện xảy ra như thế này: Các cầu thủ Chelsea sút bóng về bên phải và van der Sar đổ người sai hướng nên họ ghi bàn. Ronaldo dừng lại trong khi chạy đà, sau đó sút bóng sang trái và Cech đã cứu bóng.
Ashley Cole (màu áo 3 xanh), đã không nghe theo lời khuyên của đội và sút về phía bên van der Sar đang mong đợi – bên phải. May mắn thay, anh ta sút tốt và thủ môn không thể bắt được.
Khi cầu thủ Chelsea cuối cùng – Anelka, số 39 – bước lên thực hiện quả đá, van der Sar nghĩ rằng anh ta đã hiểu, rằng mọi người đều chỉ sút bóng về phía bên trái của mình. Vì vậy, anh ta chỉ tay về phía đó khi Anelka bước lên. Điều này khiến cho Anelka hoảng sợ và thay đổi cú sút vào phút chót (như anh ấy nghĩ), và rồi van der Sar đổ người sang phải và cứu bóng thành công.

Leave a Reply

Your email address will not be published. Required fields are marked *