Phân tích dữ liệu và tư duy phản biện

Trong Thế chiến thứ 2 có một bài toán sau:
Trên chiến trường quân đội Mỹ thu được 5 xe tăng Đức đánh số hiệu lần lượt là 54, 115, 116, 147 và 156. Biết rằng các số hiệu này đánh dấu thứ tự các xe được sản xuất, hỏi quân Đức đang sản xuất tổng cộng bao nhiêu xe tăng mỗi tháng?
Gọi số xe tăng Đức sản xuất mỗi tháng là N. Bằng cách dùng phương pháp ước lượng thống kê, phe đồng minh có thể ước lượng được gần đúng số N. Phương pháp này hiểu đơn giản như sau: dùng một công thức nào đó mà cho ra kết quả có phương sai là nhỏ nhất. Trong đó, phương sai là độ sai số của một kết quả ước lượng so với giá trị thực tế, phương sai càng nhỏ, kết quả ước lượng càng chính xác.
Dùng phương pháp đó, các nhà toán học đã tìm ra được 1 công thức để tính và số N ghi nhận được là 187.
Áp dụng thực tế:
Quân đồng minh áp dụng phương pháp trên để đếm số xe tăng Đức sản xuất mỗi tháng từ năm 1940 đến năm 1942. Họ ước tính trong tháng 6/1940, con số đó là 169, tháng 6/1941 là 244 và tháng 8/1942 là 327.
Sau khi chiến tranh kết thúc, quân Đồng minh đối chiếu kết quả tính toán với hồ sơ của Đức thì thấy trên thực tế, vào tháng 6/1940 người Đức sản xuất 122 xe tăng, tháng 6/1941 là 271 và tháng 8/1942 là 342.
Điều này cho thấy sự chính xác rất cao của phương pháp đếm kia. Bài toán này hiện nay được biết đến với tên gọi “Bài toán xe tăng Đức” (German tanks problem).

Nếu mọi người dõi cuộc chiến Nga và Ukraine thì sẽ thấy các bên liên tục đưa ra các thông tin đối nghịch nhau về tình hình chiến sự, ví dụ như số lượng thương vong của hai bên, và nghĩ rằng đó chỉ là những thông tin tuyên truyền vô căn cứ. Tuy nhiên thực tế các thông tin đưa ra không phải do các bên nghĩ ra mà là kết quả có được từ phân tích dữ liệu chiến trường áp dụng toán học, tương tự như vấn đề đếm xe tăng Đức nêu ở trên.
Trên Internet hiện giờ có một cộng đồng gọi là Cộng đồng tình báo mở (Open-source intelligence community – OSINT). Cộng đồng này thu thập mọi loại dữ liệu có thể được, áp dụng toán học để phân tích, từ đó đưa ra nhận định được chuyện gì đang xảy ra và dự đoán chuyện gì sẽ xảy ra. Họ hoạt động độc lập với tình báo của quân đội và thường đối chứng kiểm tra thông tin phía quân đội công bố.
Các dữ liệu họ thu thập gồm:

Hình ảnh chụp từ vệ tinh từ các nguồn khác nhau.

Dữ liệu các đám cháy từ NASA

Hình ảnh, dữ liệu chia sẻ trên mạng xã hội.

Dữ liệu nghe lén thông tin liên lạc của quân đội.
Các dữ liệu rời rạc này liên tục được xâu chuỗi lại để giúp tạo nên bức tranh toàn cảnh sự kiện. Cộng đồng tình báo mở này đã đóng góp lớn cho việc giúp CIA của Mỹ đưa ra kết luận Nga sẽ đánh Ukraine khi thấy các dấu hiệu bất thường như Nga lập bệnh viện dã chiến ở biên giới Ukraine (không ai làm vậy khi thời bình), các binh đoàn đóng quân lâu ở biên giới hơn so với các lần tập trận khác. Xem thêm phân tích: https://www.youtube.com/watch?v=7Hu5FErz1js
Cộng đồng tình báo này cũng khám phá ra được khả năng quan sát từ rất xa của máy bay không người lái TB2 Bayraktar mà Ukraine mua từ Thổ Nhĩ Kỳ. Chỉ bằng video ghi lại hình ảnh TB2 Bayraktar đang chỉ điểm cho pháo Ukraine bắn vào sân bay Kherson mà Nga chiếm đóng, những người chuyên toán đã tính toán được rằng chiếc TB 2 trong video đang quan sát từ khoảng cách 48km, từ đó phát hiện ra sức mạnh của máy bay này mà trước đây chưa bao giờ được công bố ra công chúng. Xem video: https://www.youtube.com/watch?v=qmlSpnjRLlo
Quân đội Nga trong thời gian đầu cuộc chiến đã để lộ điểm yếu là các thiết bị liên lạc không hoạt động ổn định, dẫn đến việc họ phải sử dụng các thiết bị dân sự và liên lạc trên băng tần không được mã hóa. Hậu quả là khi tướng 1 sao của Nga Vitaly Geraismov trong lúc liên lạc với binh sĩ đã bị hacker Ukraine nghe lén được, từ đó định vị (geolocated) được ông và sau đó ông đã bị lính bắn tỉa Ukraine giết chết ngày 07/03/2022 gần Kharkiv. Video phân tích dữ liệu nghe lén quân Nga: https://www.youtube.com/watch?v=gOmYi96cU1M
Một clip nghe lén khác về cuộc trò chuyện của lính Nga. Trong clip này có nhắc đến tên tướng 2 sao Yakov Rezanstev, quân Ukraine tuyên bố đã giết chết ông vào hôm qua 26/03. https://www.youtube.com/watch?v=b2mlqC-c6Cw
Lực lượng OSINT cũng đã làm hẳn 1 website để thống kê thiệt hại quân đội hai bên bằng cách đếm khí tài trong hình và video. Họ chỉ đếm dựa vào hình ảnh. Ví dụ quân Ukraine tuyên bố bắn cháy 5 xe tăng Nga nhưng trong video chỉ thấy 3 chiếc thì họ sẽ ghi nhận 3 chiếc. Nếu sau này có 1 video khác cũng về 3 chiếc xe tăng đó nhưng quay ở góc khác thì cũng sẽ không được tính. Đây là website: https://www.oryxspioenkop.com/2022/02/attack-on-europe-documenting-equipment.html
Và tất cả những gì mà OSINT thu thập được còn ít hơn so với lực lượng tình báo và trinh sát quân đội thu thập được. Quân đội Mỹ có cả một bộ phận chuyên nghe lén liên lạc trên chiến trường. Đọc thêm chia sẻ từ một chuyên viên tình báo Mỹ về chiến trường Afghanistan: https://www.theatlantic.com/ideas/archive/2021/08/what-i-learned-while-eavesdropping-on-the-taliban/619807/
Do đó để giải đáp thắc mắc rằng tại sao khối NATO có thể đưa ra các nhận định chắc nịch rằng kế hoạch tiến công của Nga bị “thất bại” hoặc quân Nga đang gặp khó khăn lớn về hậu cần, tinh thần đi xuống, hoặc số lính Nga chết trận dao động từ khoảng 7,000 đến 15,000 tất cả là do thu thập mảnh ghép từ những dữ liệu rời rạc. Và vì NATO và Ukraine đều kín tiếng về dữ liệu thu thập được phía Ukraine nên chúng ta ít nghe được phân tích độc lập về phía Ukraine hơn, chỉ có 1 nguồn là nghe từ Nga. Nhưng suốt hơn một tháng đến giờ, có thể nói các nguồn tin chính thống từ Nga vừa rất ít lại vừa có chất lượng thấp.
Ví dụ Nga tung tin có phòng nghiên cứu sinh học ở Ukraine do Mỹ tài trợ. Câu hỏi đặt ra là: nếu đó là nghiên cứu vũ khí thì sao Mỹ ko đặt ở Mỹ cho an toàn mà lại đặt ở Ukraine, nơi có đầy gián điệp Nga và luôn có mối nguy chiến tranh? Thứ hai là không phải cứ nghiên cứu sinh học là để chế tạo ra vũ khí. Ngay cả ở Việt Nam cũng có viện nghiên cứu sinh học do Mỹ tài trợ với mục tiêu là nghiên cứu phát triển các giống cây ăn quả.
Khái niệm phân tích dữ liệu này vẫn còn xa lạ ở Việt Nam, nên khi mọi người nghe một tin báo cáo từ chiến trường mọi người đều nghĩ rằng “đó là tin tuyên truyền”, phóng đại tung hỏa mù, chứ ít khi nghĩ rằng đó là kết luận từ phân tích chuyên sâu về một sự kiện.
Riêng với báo chí ở VN, chắc chắn là không có phân tích gì có giá trị cả.
Nguồn: huskywannafly

Leave a Reply

Your email address will not be published. Required fields are marked *