Nhiều người nghĩ rằng nhân loại đã khám phá ra tất cả bí mật về gen người vào năm 2003 khi các nhà khoa học tuyên bố giải mã thành bông bộ gen người. Tuy nhiên, vẫn có một số bộ phận đã bị bỏ qua, nhưng đó là những khoảng trống nhỏ vì chúng dường như không mã hóa bất kỳ chức năng nào (thứ vào thời điểm đó được coi là "DNA rác").
Nhưng ngay cả "rác" cũng có những "kho báu" tiềm tàng. Các nghiên cứu mới đây cho thấy các biến thể ở những vùng không theo trình tự này có liên quan phức tạp đến sức khỏe con người, từ lão hóa đến các bệnh như ung thư và rối loạn phát triển như tự kỷ.
Trong khoảng thời gian gàn đây, một nghiên cứu mang tính bước ngoặt cuối cùng đã giải quyết được ẩn số về bộ gen, phân tích trình tự hoàn chỉnh của những DNA chưa được giải mã trước đó.
Giờ đây, các nhà khoa học đang phát hiện ra rằng một số trình tự gen mã hóa các protein không có bất kỳ tổ tiên rõ ràng nào, và các nhà di truyền học gọi là chúng gen mồ côi.
Các nhà nghiên cứu phỏng đoán, một số gen mồ côi này phát sinh một cách tự nhiên khi chúng ta tiến hóa, không giống như những gen khác mà chúng ta thừa hưởng từ tổ tiên của mình.
Trong một bài báo được xuất bản hôm thứ ba trên tạp chí Cell Reports, các nhà nghiên cứu ở Ireland và Hy Lạp đã tìm thấy khoảng 155 phiên bản nhỏ hơn của trình tự DNA (ORF), tạo ra các vi protein có khả năng quan trọng đối với sự phát triển của tế bào khỏe mạnh hoặc liên quan đến một loại bệnh như chứng loạn dưỡng cơ và viêm võng mạc sắc tố, một bệnh di truyền hiếm gặp ảnh hưởng đến mắt.
"Tôi nghĩ đây là nghiên cứu đầu tiên xem xét nguồn gốc tiến hóa cụ thể của các DNA nhỏ này và các vi protein của chúng", Nikolaos Vakirlis, nhà khoa học tại Trung tâm Nghiên cứu Khoa học Y sinh ở Hy Lạp và là tác giả đầu tiên của bài báo, cho biết.
Hầu hết chúng ta đều quen thuộc với DNA bao gồm 4 khối xây dựng hóa học được gọi là nucleotide: adenosine (A), thymine (T), cytosine (C) và guanine (G). Các trình tự cụ thể, ví dụ như AATCGA, là công thức mà các ribosome tạo ra protein của riêng chúng.
Khi một ribosome đang đọc một loạt nucleotide, một chuỗi ba gọi là codon sẽ cũng cấp thông tin biết nơi bắt đầu và ngừng đọc, giống như trang đầu tiên và trang cuối cùng của một cuốn sách.
Aoife McLysaght, Giáo sư di truyền học tại Trinity College Dublin ở Ireland và là tác giả chính của bài báo, nói với Inverse rằng khoảng trống ở giữa codon bắt đầu và codon kết thúc được gọi là ORF.
Cô ấy giải thích: "Đó là một đoạn DNA có khả năng mã hóa một loại protein có độ dài nhất định. Tuy nhiên chúng tôi không biết liệu đó có phải là gen hay không do đó vẫn cần phải nghiên cứu thêm".
Nguyên tắc chung mà các nhà khoa đồng tình là ORF càng dài thì cơ hội nó mã hóa một loại protein sẽ có chức năng càng cao.
"Khi ORF có độ dài tương đối ngắn, về cơ bản, chúng tôi không thể biết được nó mã hóa cho thứ gì, nó có ý nghĩa về mặt sinh học hay chỉ xảy ra một cách ngẫu nhiên thì vẫn cần phải nghiên cứu thêm", McLysaght nói.
Nếu những ORF nhỏ này quan trọng và tạo ra các protein có ảnh hưởng, thì liệu chúng có thể giải thích cách thức các gen mới tiến hóa và các đặc điểm mới xuất hiện trong một loài không?
Có vô số ORF nhỏ trong bộ gen, vì vậy việc sàng lọc xem cái nào hoạt động và không hoạt động là một điều vô cùng cần thiết. Sau đó truy tìm tổ tiên của chúng sẽ là một nhiệm vụ lớn tiếp theo của các nhà nghiên cứu.
Ở thời điểm hiện tại, các nhà khoa học đã phân tích một bộ dữ liệu gồm các ORF nhỏ ở người đã được xác định là có chức năng sinh học và ghép lại thành một cây phát sinh loài, một sơ đồ biểu thị mối quan hệ tiến hóa giữa các sinh vật.
Điều này được thực hiện bằng cách so sánh trình tự của ORF nhỏ với các trình tự tương tự ở các loài có quan hệ họ hàng gần với con người như tinh tinh, đười ươi, khỉ đột...
McLysaght nói: "Nếu bạn chỉ có thể tìm thấy ORF ở người, thì nó có vẻ sẽ là đặc trưng của con người. Nhưng nếu đó là thứ được tìm thấy ở những loài linh trưởng khác, thì nó có thể đến từ một tổ tiên chung".
Các nhà khoa học đã phát hiện ra rằng có khoảng 155 ORF nhỏ tạo ra các vi protein phát sinh hoàn toàn từ đầu — thứ được gọi là sự ra đời của gen de novo — trong các vùng duy nhất trong DNA.
Hơn một phần tư trong số các trình tự di truyền ngắn này (cụ thể là 44) dường như chỉ xuất hiện ở con người và gây ra các khuyết tật tăng trưởng trong các dòng tế bào bất tử (đây là những tế bào thường không gặp vấn đề gì khi phát triển vì chúng có một đột biến giúp chúng tiếp tục nhân lên).
Ba ORF khác dường như có liên quan đến các bệnh như loạn dưỡng cơ, viêm võng mạc sắc tố và một tình trạng di truyền hiếm gặp ảnh hưởng đến sự phát triển gọi là hội chứng Alazami có liên quan đến một gen có tên LARP7.
Một ORF khác dường như có liên quan chặt chẽ với mô tim và là ORF mà con người chia sẻ với tinh tinh. Điều này cho thấy rằng một khi sự chia rẽ tiến hóa xảy ra, các gen có thể tiến hóa khá nhanh trong một loài.
McLysaght và Vakirilis nói rằng đây mới chỉ là bước khởi đầu để hiểu cách ORF tham gia vào việc tạo ra các gen mới, quá trình tiến hóa của con người và vai trò của chúng đối với sức khỏe và bệnh tật.
Vakirlis nói: "Còn rất nhiều việc phải làm và rất nhiều ORF cần nghiên cứu. Ví dụ, không phải mọi gen mới đều mang lại lợi ích sinh học. Nhiều loại có thể gây bất lợi và gây hại cho một sinh vật".