Điều này nói đến cả trình tự DNA mã hóa và không mã hóa. Nhưng mà thật ra con số 0.1% của sự khác nhau về trình tự đã khá là lỗi thời. Con số khác nhau này có thể dao động cao hơn, dựa theo 1000 dự án nghiên cứu về bộ gen. Khẳng định này có đề cập trong bài báo “A global reference for human genetic variation”.
Chúng tôi nhận thấy rằng một bộ trình tự gen người đặc trưng bất kỳ nào đó sẽ có 4.1 triệu đến 5.0 triệu vị trí khác nhau khi so sánh với bộ gen người tham chiếu. Mặc dù lớn hơn 99.9% các biến thể trình tự này bao gồm các đoạn SNP và các đoạn đột biến thêm/bớt ngắn (short indels), các đột biến cấu trúc sẽ ảnh hưởng đến nhiều nucleotide hơn: một bộ gen người đặc trưng bất kỳ chứa khoảng 2100 đến 2500 biến thể thay đổi cấu trúc [bao gồm ~1000 biến thể mất đoạn lớn (large deletion), ~160 đột biến số lượng bản sao (copy-number variant), ~915 biến thể chèn đoạn Alu, ~128 biến thể chèn đoạn L1, ~51 biến thể chèn đoạn SVA, ~4 biến thể NUMTs, và ~10 biến thể đảo đoạn], ảnh hưởng đến ~20 triệu nucleotide.
Con số ~20 triệu nucleotide chiếm ~0.6% chiều dài toàn bộ gen người.
(T/N: nucleotide là một đơn vị cơ bản cấu trúc của gen;
SNP – single nucleotide polymorphisms – loại biến dị di truyền thay thế loại nucleotide này thành nucleotide khác không bổ sung;
biến thể NUMT – nuclear mitochondrial DNA – dạng đột biến trình tự do sự di chuyển của một đoạn gen ty thể trong tế bào chất chèn vào gen trong nhân tế bào)
Tôi nghĩ đa số mọi người không nhận ra rằng con số 99.9% mang tính hơi phỏng đoán từ cách đây 20 năm. Phải nhờ đến 1000 dự án nghiên cứu bộ gen khác nhau để thật sự tính toán con số sự khác biệt về trình tự gen giữa người với người.
Ngoài ra, câu trả lời thật sự cho câu hỏi trên thật sự không tồn tại bởi vì con số sự khác nhau giữa các biến thể phụ thuộc vào cách bạn đếm chúng như thế nào.
Vài đoạn DNA nhân đôi và chồng lấn lên những đoạn khác, vậy thì cái đó được đếm như là một điểm hay bốn điểm khác biệt? Vài đoạn DNA có thể giống y hệt giữa hai người, tuy nhiên sự biểu hiện biểu sinh của những gen đó sẽ không giống nhau, trong trường hợp này thì được tính là một sự khác biệt hay là không tính?
Con số đó sẽ luôn là một con số phỏng đoán.
Tôi đồng ý với quan điểm trên. “Tỷ lệ các nucleotide không dùng chung giữa các gen” là vừa đủ, như là một cách nửa khách quan để so sánh sự khác biệt giữa hai bộ gen mà không cần đào sâu vào gốc rễ điều gì đã tạo nên sự khác biệt đó. Cuối cùng, có nhiều sự khác biệt mà đơn giản là không biểu thị bằng phần trăm chênh lệch (chẳng hạn như chuyển vị gen/chuyển vị nhiễm sắc thể)
Vì tất cả những thứ này nhằm tạo ra protein, công bằng mà nói thì việc tính toán sự khác biệt trên thiên về những thứ tạo ra những protein khác nhau.
Vì thế, nếu một đoạn gen/allele di chuyển tới một vị trí khác, nó vẫn được tính như là không có sự khác biệt.
Việc tạo ra protein từng là một khái niệm khoa học gợi nhớ về thời kỳ mà thuật ngữ “DNA rác” còn phổ biến, nhưng kể từ đó thì chúng ta đã nhận ra rằng có những trình tự DNA có chức năng nhưng không tạo ra protein. Vùng gen khởi động (promoter) và quá trình cắt nối thay thế mRNA (alternative splicing) là một trong những ví dụ kể trên. Có những đoạn chèn gen quan trọng mà ban đầu được cho là không có chức năng nhưng có vẻ được khuếch đại ở một số vùng gen. Ngày nay, người ta đặt ra giả thuyết rằng chúng là nguồn gốc của việc tiến hóa nhanh chóng, chẳng hạn như trong tế bào thần kinh, điều mà đóng góp đến sự tiến hóa phân kỳ của loài người khỏi tinh tinh. Di truyền học biểu sinh là những gốc methyl xung quanh DNA, chúng có thể mở hay đóng các gen nhằm ngăn chặn việc các gen biểu hiện ra protein. Chúng có thể được thúc đẩy chủ yếu bởi điều kiện môi trường và thường xuyên thay đổi. Cũng có những đoạn DNA mà có thể tự gấp cuộn để ngăn chặn sự biểu hiện gen.
Nếu bạn chỉ nhìn vào bộ gen gốc và nói rằng chỉ có những đoạn gen tạo ra protein được tính đến, thì bạn không có cách nào biết được:
số lượng;
số loại;
tốc độ biểu hiện gen;
và liệu gen đó có đang biểu hiện protein hay không.
Mà không tính đến những đoạn gen không tạo ra protein còn lại. Ngoài ra, những thứ kể trên vẫn đang được nghiên cứu và vẫn chưa có cách nào để tính toán cụ thể những thứ kể trên.
Ừ thì… đại khái là thế. Trong khi việc mã hóa protein của gen được cho là quan trọng nhất và chắc chắn là chức năng dễ nhận biết nhất của gen, có những phần khác của bộ gen mã hóa cho RNA mà không được dịch mã ra thành protein. Những trình tự DNA này và những đoạn gen không mã hóa cho protein thực sự tạo nên phần lớn bộ gen của người, và nhiều trong số chúng đóng vai trò quan trọng. Mặc dù vậy, đúng là hầu như tất cả những vai trò đó hỗ trợ cho việc biểu hiện gen hoặc là điều hòa protein theo những cách gián tiếp.
Ngoài ra, một gen di chuyển đến một locus khác thật sự có thể tạo ra sự khác biệt lớn vì cái cách mà chúng được biểu hiện và điều hòa có thể thay đổi, ngay cả khi chúng mã hóa cho cùng loại protein.
Cũng đừng quên rằng các epigenome (methyl hóa – methylation, acetyl hóa – acetylation, thay đổi chỉnh sửa histone – một loại protein cấu trúc nên nhiễm sắc thể, vv.) cũng có thể làm cho hai trình tự DNA gần như giống hệt nhau hoạt động một cách rất khác nhau.
Điều này đã được kiểm chứng và quan sát ở các cặp sinh đôi cùng trứng, và hiện tượng này vẫn đang được nghiên cứu kỹ lưỡng.
Điều này thường đề cặp đến sự so sánh của cả trình tự gen. Tuy nhiên, cái khái niệm nền tảng rằng con người có đa dạng di truyền rất thấp là đúng. Những thứ như tần số allele vẫn là cách quan trọng để đo lường sự đa dạng di truyền. Khi so sánh với các loài động vật khác, con người có tính đa dạng di truyền rất thấp vì quần thể người tăng trưởng rất nhanh và di cư khắp thế giới trong khoảng một thời gian rất ngắn.
Thống kê cũ này luôn được dùng như là ví dụ diển hình để cho thấy chúng ta “giống” nhau đến như thế nào, nhưng thực tế nó là một thống kê khá là vô nghĩa. Chúng ta chia sẻ 96% DNA với tinh tinh, 99.84% với người Neanderthals. Và 2-4% bộ gen của người không-thuộc-Phi-châu đến từ DNA của người Neanderthals.
Một SNP đơn hay là 1 nucleotide thay đổi trong 3,054,815,723 nucleotide của bộ gen cũng có thể là sự khác biệt giữa người bình thường và một sát thủ máu lạnh
(https://pubmedncbinlmnihgov/24326626/)