Human learning
#wednonquora
Ngày 15/8/1977, trạm thiên văn Big Ear, Ohio, Hoa Kỳ thu nhận được một tín hiệu lạ từ vũ trụ. Vài ngày sau, tiến sĩ Jerry Ehman, người phụ trách trạm, xem lại các bản ghi và phát hiện ra chúng. Bất ngờ với kết quả tìm được, ông đã để lại lời nhắn trên giấy: “Wow!”. Tín hiệu “Wow!” này lạ thường đến mức nó khác với tất cả những gì mà họ đã từng quan sát trước đó, khiến các nhà khoa học đặt rất nhiều giả thuyết về nó; song, đến ngày nay vẫn chưa có lời giải đáp thoả đáng.
—
Trong những năm gần đây, khoa học máy tính có những tiến bộ vượt bậc. Cụm từ “machine learning” có lẽ không còn quá xa lạ với nhiều người nữa. Tôi thích cách dịch thuật ngữ này là “học máy”, với ý nghĩa rằng đây là lĩnh vực nghiên cứu về cái “sự học” của máy, hay cách mà máy tính “học tập”.
Quy trình của một bài toán machine learning như sau: trước hết xác định vấn đề cần giải quyết, tiếp theo là tìm kiếm bộ dữ liệu về vấn đề đó. Khi có một lượng dữ liệu đủ lớn, người ta đưa một phần trong số đó vào một thuật toán “machine learning” để máy tính “học”, mà bản chất là xây dựng một mô hình (model) toán học sát nhất với tập dữ liệu đã cho.
Sau đó, người ta lấy phần còn lại của bộ dữ liệu để kiểm thử, xem chúng có khớp với mô hình mà ban nãy xây dựng hay không. Nếu chưa, phải xem lại thuật toán hoặc kiếm thêm dữ liệu; ngược lại, nếu kết quả cho ra tốt, người ta tự tin rằng mô hình đã xây dựng được là sát nhất với thực tế, tức có thể dùng để biểu diễn và phán đoán các quan sát trong tương lai (không nằm trong tập dữ liệu đã thu thập ban đầu).
Như vậy với dữ liệu “huấn luyện” cho thuật toán, máy tính có thể tính toán, để trong tương lai nếu gặp một điểm dữ liệu nào đó chưa được “huấn luyện”, nó vẫn có thể đưa ra quyết định nhờ vào những gì rút ra từ quá khứ. Đó là lý do người ta gọi là “machine learning”, vì nó thực sự “học” được từ những thứ được ta “dạy dỗ” cho.
—
Con người từ xưa đến nay luôn muốn tìm những quy luật của vũ trụ, hay gần gũi hơn là của thế giới. Ngày xưa, người ta cho rằng Trái Đất hình vuông, Mặt Trời và các vì sao thì hình tròn, quay xung quanh Trái Đất. Nhưng rồi người ta cũng quan sát được sự chuyển động của các thiên thể, và thấy rằng suy nghĩ đó là sai lầm.
Họ đề xuất ra Thuyết nhật tâm, ở đó Trái Đất hay các vì sao đều có hình cầu, Mặt Trời mới là trung tâm và Trái Đất mới quay quanh nó.
Mô hình mới dần được mọi người tin tưởng, đặc biệt là giới khoa học, bởi nó giải thích được những hiện tượng mà ngày xưa chưa thể giải thích được.
Ban đầu, loài người chỉ có những quan sát hạn chế. Họ tỉnh dậy thấy Mặt Trời mọc ở đằng Đông, rồi cuối ngày thấy nó lặn đằng Tây. Các nhà khoa học đã xây dựng ra một model tương đối ổn, đủ để giải thích hầu hết các hiện tượng họ quan sát được vào lúc đó (số ít chưa giải thích được thì gán cho thần tiên thánh chúa, ez). Ai ai cũng cảm thấy hài lòng, hợp lý.
Thế nhưng khi số ngoại lệ tăng lên nhiều quá, người ta nói rằng model cũ là “sai”, không còn phù hợp cho tổng quát nữa rồi. Thế là cả một hệ thống lý thuyết khoa học mới lại được xây dựng lên, sao cho nó giải thích được những quan sát mới thấy. Người ta lại gật gù với nhau về mô hình mới này, coi nó là chân lý của vạn vật.
Tại sao loài người phải mất công xây đi rồi lại xây lại cả một hệ thống khoa học, các bộ quy luật của thế giới để làm gì? Câu trả lời rất hiển nhiên: để giải thích cho tất cả mọi thứ thuộc trong miền hiểu biết, và phán đoán những sự kiện thậm chí nằm ngoài miền hiểu biết đó.
Chẳng hạn: Newton thấy quả táo rơi từ cây xuống, ông xây dựng ra định luật mà từ đó người ta sẽ biết rằng nếu nhảy từ trên tầng 20 xuống cũng cho kết quả tương tự, không cần phải nhảy thử làm thí nghiệm làm gì.
Hay dù chưa ai biết lỗ đen, lỗ trắng, năng lượng tối, vật chất tối… là cái quái gì, nhưng các nhà vật lý lý thuyết xây dựng nên hệ thống lý thuyết của mình, trên cơ sở đó họ có quyền đưa ra giả thiết về những vấn đề bí ẩn đó.
Khoa học ở đây không chỉ là khoa học tự nhiên, mà còn có cả khoa học xã hội. Khổng Tử cho rằng “nhân chi sơ, tính bản thiện”, rằng con người phải phát huy tính thiện vốn có, phải sống thật lành mạnh, để tính dữ không có điều kiện nảy sinh.
Nhưng sau đó vì xã hội loạn lạc, Tuân Tử lại cho rằng “nhân chi sơ tính bản ác”, tức phải áp dụng luật lệ chặt chẽ, giáo huấn nghiêm khắc để diệt trừ cái ác đó, nếu không xã hội tất loạn.
Rồi vô số trường phái Triết học, học thuyết ra đời để mô hình hoá xã hội, rốt cuộc cũng nhằm giải thích được nhiều nhất có thể những sự kiện lịch sử – xã hội, và phần nào đề xuất ra viễn cảnh của tương lai.
Ai đó đã xây dựng lên những thư viện machine learning tuyệt vời, chứa các model đủ chính xác, để người khác chỉ cần chấm và gọi hàm ra sử dụng thôi (tất nhiên là phải hiểu về nó, đọc doc chẳng hạn, giống như cách mà chúng ta truyền bá khoa học bằng giáo dục).
Như vậy, chẳng phải cả xã hội loài người từ lúc hình thành đến tương lai, họ đã, đang và sẽ giải bài toán “human learning” bằng cách đề xuất ra những kiến thức, quy luật mới, để ai cũng có thể áp dụng một cách dễ dàng.
—
Trong machine learning có khái niệm overfit và underfit. Vậy “human learning” thì sao? Tất nhiên là cũng có.
Hoá học cổ điển cho rằng phản ứng chỉ xảy ra do trao đổi e, biến đổi ở mức phân tử, nguyên tử. Từ đó mà ta có định luật bảo toàn nguyên tố, định luật bảo toàn khối lượng, định luật bảo toàn điện tích… Mọi người thấy chúng khớp với những thí nghiệm thu được, và cả rất nhiều hiện tượng trong đời sống. Mô hình này khớp hoàn hảo với tập dữ liệu được “huấn luyện”.
Rồi những quan sát mới trong những thí nghiệm về phóng xạ, phân hạch, mô hình này tỏ ra bất lực. Khối lượng không còn bảo toàn nữa; vế phải của phương trình có những nguyên tố mà không xuất hiện bên vế trái.
Model khớp hoàn hảo với training data, nhưng cho kết quả rất tệ với test data, và cả những dữ liệu mới quan sát được. Đó là overfitting.
Thế kỷ 21 này vẫn có một nhóm người tin rằng Trái Đất phẳng. Họ đề xuất mô hình Trái Đất là một đĩa dẹt, chuyển động đi lên với gia tốc g, cái chúng ta gọi là Bắc cực thực ra là tâm của chiếc đĩa, còn Nam cực là bức tưởng băng phía rìa. Mặt Trời, Mặt Trăng và các thiên thể đều quay xung quanh chiếc đĩa dẹt này.
Nghe có vẻ hợp lý, nhưng thực ra không thuyết phục cho lắm. Còn hàng tá thứ mà mô hình này không giải thích được, chưa cần nói đến những thứ mà trong tương lai biết đâu sẽ bắt gặp. Đây chính là underfitting.
—
Bài toán “human learning” này sẽ mãi đang trong quá trình giải. Trong từng giai đoạn, model hợp lý nhất thì nhân loại có thể dùng nó, nhưng bên cạnh đó người ta không ngừng thu thập thêm những dữ liệu mới để cải thiện, thậm chí là thay hẳn một model khác.
Công việc này mà dừng lại, đồng nghĩa với việc loài người ngừng tư duy. Descartes nói “Tôi tư duy, tôi tồn tại”. Vậy có lẽ rằng, chỉ khi loài người diệt vong, bài toán “human learning” mới không còn được nghiên cứu nữa.
Những người bình thường nhìn vào một thứ gì đó không tuân theo quy tắc, thì lập tức có suy nghĩ rằng: “Đm, cái đ gì vậy! Vô lý!”. Trong khi các nhà khoa học, những người đang giải “human learning”, có thể sẽ ôm nhau và reo lên rằng: “Đm đây rồi, nó đây rồi!”.
Ngoài kia có hàng triệu bộ não và cặp mắt đang kiếm tìm. Họ kiếm tìm nhiều hơn nữa những thứ như tín hiệu “Wow!” năm nào. Sứ mệnh của họ rất rõ ràng: giải tiếp bài toán “human learning” vĩ đại.
10:35 PM 30/08/2020
L