Tôi đang học Giải tích đa biến và thấy định thức nhiều khi cần. Tôi đã tìm kha khá trên mạng nhưng chả hiểu gì. Cũng đã đọc bài này trên stackexchange [http://math.stackexchange.com/…/whats-an-intuitive-way…] cũng dẫn đến subreddit này trước đó, nên tôi hiểu nó biểu diễn cho diện tích/thể tích, nhưng đó chỉ là một phần nhỏ thôi.
Ví dụ, tại sao ta phải dùng đồng hệ số để tính tích có hướng của hai vectơ? Tại sao ma trận Hessian lại dùng để xác định điểm tới hạn là cực đại, cực tiểu hoặc điểm yên ngựa? [T/N: Đạo hàm theo các biến bằng 0 nhưng không phải điểm cực trị]
Edit: Wow, cảm ơn mọi người đã trả lời rất nhiều. Một số câu trả lời hơi khó hiểu đối với tôi, một số lại ở dưới một chút, nhưng đều có những cách giải thích khác nhau. Tôi đã hiểu hơn một chút rồi. Tôi nhận ra việc học lớp Đại số tuyến tính khi chuyển từ Cao đẳng cộng đồng lên Đại học thực sự đã giúp ích rất nhiều. Mọi người hỏi thêm một số câu là lại vỡ ra một số hướng mới. Ai giải thích một cách trực quan trị riêng không ạ? Nếu một ma trận được xây dựng từ các vectơ, thì có vẻ như chúng thường là các cột, nhưng đôi khi chúng lại là hàng, sao lại như vậy?
_____________________
Nếu đã học đại số tuyến tính, bạn đã được lướt qua một số định nghĩa chính xác về định thức, nhưng thường chúng không đi sâu vào việc thực sự nó là cái gì. Các văn bản toán học hiếm khi cho ta thấy hướng phát triển, chúng thường chỉ đưa ra định nghĩa, chứng minh các định lý, và hi vọng bạn hiểu được ý nghĩa của chúng. Nói thật ra thì bực lắm chứ đùa.
Tôi đã mất rất nhiều thời gian để tìm xem thực sự định thức là gì, theo cách nhìn trực quan nhất, và thực sự nó không khó đến như thế. Cho nhanh gọn, đây là những gì tôi tìm được. Vào lúc này, ma trận là những thứ tác động lên các vectơ, đúng chứ? Một ma trận tác động lên một vectơ sẽ sinh ra một vectơ khác. Ví dụ, lấy một ma trận vuông thực cỡ 3×3. Coi mỗi cột của ma trận này là một vectơ ba thành phần. Gọi A1, A2, A3 lần lượt là cột thứ nhất, thứ hai và thứ ba của A. Chuyện gì sẽ xảy ra nếu tác động ma trận A lên một vectơ ba thành phần (x, y, z)? Ta sẽ thu được một vectơ kết quả: xA1 + yA2 + zA3. Vậy, về cơ bản , kết quả khi tác động một ma trận lên một vectơ là một vectơ, vectơ này là một tổ hợp các cột của ma trận.
Để cảm nhận được thực sự chúng ta đang làm gì, hãy xét trường hợp các vectơ A1, A2 và A3 tổng hợp ra ma trận A đều nằm trên mặt phẳng xy. Tức là, chúng không có thành phần thứ 3 z. Chỉ với điều kiện này, kết quả khi tác động A lên bất cứ vectơ nào đều cho kết quả là một vectơ không có thành phần z. Tại sao ư? Bạn không thể sinh một vectơ có thành phần z mà dùng các vectơ không có thành phần z được!
Ma trận có vẻ như một “hộp các vectơ”, ta có thể dùng nó để sinh ra các vectơ khác. Tuy nhiên, các vectơ có thể sinh ra được bị hạn chế bởi những gì có trong hộp. Nếu trong hộp chỉ gồm các vectơ có hai thành phần x, y mà không có z, ta không thể sinh ra vectơ có thành phần z được.
Thực tế, bạn có thể thắc mắc: nếu ta có ma trận A và một số vectơ v, có cách nào để tìm một vectơ w khác sao cho A tác động lên w sẽ thu được v? Hoặc, nói cách khác, liệu có bộ các vectơ nào đủ tốt để kết hợp với nhau thành ma trận A thì có thể sinh ra mọi vectơ ta muốn? Một con số, định thức, sẽ trả lời câu hỏi này cho bạn.
Đó chính là định thức. Lấy ma trận A, xét ba vectơ cột tương ứng A1, A2, A3. Vẽ các vectơ này trên một đồ thị có trục xyz. Ta vẽ một hình hộp từ ba vectơ này. Định thức chính là thể tích của hình hộp này.
Thể tích của hình hộp này cho ta biết điều gì? Hãy xét trường hợp 3 vectơ A1, A2 và A3 đều nằm trên mặt phẳng xy, tức không có thành phần z. Vì các vectơ này không có thành phần z, hình hộp sinh ra sẽ không có chiều cao. Vì không có chiều cao nên thể tích hình hộp bằng 0! Định thức của ma trận vì thế cũng bằng 0.
Vậy câu hỏi ban đầu đã được trả lời. Bộ vectơ tạo nên ma trận phải đủ tốt để sinh ra mọi vectơ nếu định thức của ma trận đó khác không. Bạn có thể nhớ ở đâu đó rằng nếu một ma trận khả nghịch khi và chỉ khi định thức của nó khác không. Một ma trận có định thức khác không về cơ bản có các vectơ đủ “đa dạng” để thể tích khác không. Tất cả các “hướng” trong không gian đều phải được tính đến. Các vectơ không có thành phần z sẽ “bỏ qua” hướng z, và đó là lí do chúng không đủ tốt để sinh vectơ có thành phần z. Khái niệm chính xác của “đa dạng” chính là độc lập tuyến tính.
Tổng kết lại, cách đơn giản để hiểu về định thức của một ma trận là thể tích của hình hộp tạo bởi các vectơ cột của ma trận đó. Một trong những lý do ta quan tâm đến thể tích (so với những thứ khác) là bởi nó cho ta biết ma trận như thế nào là khả nghịch.
Mong giúp được bạn phần nào.
_____________________
u/lickorish_twist (9 points)
Tôi nghĩ bạn đã xem ở bài trên stackexchange, câu trả lời cho việc định thức là gì. Nhưng như thế rất khó để tóm lược lại. Tổng kết lại: định thức là một ánh xạ duy nhất từ ma trận đến số [thực] thoả mãn một số tính chất đại số. Tương đương như vậy, nó cho ta biết một ánh xạ tuyến tính/ma trận sinh ra diện tích hoặc thể tích.
Nhưng tại sao chúng cứ xuất hiện mãi vậy? Để ý rằng bạn có thể hỏi cùng một vấn đề về rất nhiều thứ trong toán học. Nếu pi là tỉ số giữa chu vi và đường kính [của một đường tròn], vậy tại sao nó lại xuất hiện khi ta cộng 1 + 1/4 + 1/9 + …?
Nhưng đây là một câu trả lời tại sao chúng lại xuất hiện nhiều như thế: định thức là điều cơ bản của tính độc lập. Để tôi giải thích. Ma trận là cách biểu diễn “biến đổi tuyến tính”. Ví dụ, ánh xạ F(x, y) = (2x – y, – x+ 3y) là tuyến tính. Để biểu diễn ánh xạ này bằng một ma trận, ta cần chọn 2 vectơ — ta chọn (1, 0) và (0, 1), ví dụ thế — và điều gì xảy ra với chúng nếu biểu diễn bằng các vectơ này. Trong trường hợp này, ta có (2, 1) = 2(1, 0) + 1(0, 1) và (-1 , 3) = -1(1, 0) + 3(0, 1). Vậy ta sẽ có một ma trận với các phần tử 2, 1, -1, 3.
Nhưng ta có thể chọn một cặp vectơ khác và biểu diễn chúng theo cách khác, và ta sẽ thu được một ma trận khác. Nhưng cho dù ta chọn như thế nào, và ma trận thu được ra làm sao, thì định thức của chúng vẫn không hề thay đổi. Chúng phải như thế, vì nó là ý nghĩa hình học – chính là “diện tích”.
Theo cách đó, các ma trận tương ứng với một phép biến đổi tuyến tính đều được gọi là “đồng dạng”. Vậy nên định thức sẽ giống nhau với hai ma trận đồng dạng (điều này cũng đúng với vết của ma trận. cũng có ý nghĩa hình học riêng). Phần lớn các ánh xạ khác định nghĩa bằng ma trận thường sẽ không giống nhau với các ma trận đồng dạng, nên chúng khá là vô dụng.
Với câu hỏi cụ thể của bạn… Đầu tiên, hãy nhìn vào tích có hướng. Để ddơn giản, giả sử ta có hai vectơ v = (v1, v2, 0), w = (w1, w2, 0). Giả sử ta định nghĩa tích có hướng của chúng là (0, 0, |v||w|sin(theta)), với theta là góc giữa chúng. Ta làm như vậy vì ta muốn tích có chướng xác định kích thước của chúng và phần mở rộng chúng vuông góc.
Nhưng nếu ta tạo một hình hộp bên ngoài v và w, diện tích phần này sẽ đúng bằng |v||w|sin(theta). Vậy nên để tính v x w, ta lấy định thức của ma trận có hàng (v1, v2); (w1, w2), vì định thức biểu diễn diện tích mà!
Ma trận Jacobi cho ta cách tốt nhất để xấp xỉ tuyến tính hàm số của chúng ta xung quanh một điểm. Nếu ta cộng thêm ma trận Hessian, ma trận đạo hàm cấp hai ấy, ta sẽ xấp xỉ theo hàm bậc hai. Hoá ra nếu ta thay đổi cơ sở — xem xét moij thứ bằng một bộ vectơ mới thay vì dùng cơ sở chính tắc — ta có thể khiến ma trận Hessian thành ma trận đường chéo. Nếu các phần tử của đường chéo đều dương, tất cả đều sẽ cong lên trên, đó là cực tiểu. Nếu tất cả đều âm, tất cả cong xuống dưới. Một số cái âm, một số dương, thì nó là điểm yên ngựa. Nếu tất cả bằng 0, ta cần xét đạo hàm cấp 3 xem chuyện gì xảy ra.
Nhưng mối liên hệ với định thức lại như thế này. Với một ma trận đường chéo, định thức là tích của các phần tử trên đường chéo. Nếu định thức bằng 0, một số phần tử bằng 0, thì khá là tệ… ta sẽ chẳng biết chuyện gì đang xảy ra cả. Nếu định thức khác 0, tất cả các phần tử trên đường chéo đều khác 0. Với một hàm hai biến, nếu định thức âm thì 2 phần tử đường chéo là trái dấu, vậy là điểm yên ngựa; nếu định thức là dương, chúng cùng dấu, vậy chúng là điểm cực trị. Chi tiết hơn, đương nhiên rồi, mời bạn xem Wikipedia.
_____________________
Vết của một ma trận vuông là tổng các phần tử trên đường chéo chính của ma trận đó. Trong hình học, đây có thể coi là một sự thay đổi nhỏ của thể tích (~ đạo hàm của định thức), miêu tả chính xác bằng ma trận Jacobi.
Ma trận Jacobi là ma trận vuông các đạo hàm từng phần bậc nhất của hàm giữa hai không gian vectơ.
Ma trận Hessian là ma trận vuông các đạo hàm từng phần bậc hai của một hàm số nhiều biến.
Ma trận đường chéo là ma trận chỉ có các phần tử đường chéo khác 0, các phần tử còn lại đều bằng 0.