Thông tin Đề tài

Tên đề tài Các phương pháp xấp xỉ trong hai bài toán tin sinh học: tìm motif DNA và xây dựng đồ thị ARG
Mã số đề tài ĐLTE00.01/19-20
Cơ quan chủ trì (Cơ quan thực hiện) Viện Công nghệ Thông tin
Thuộc Danh mục đề tài Chương trình hỗ trợ cán bộ trẻ của Viện Hàn lâm KHCNVN
Họ và tên Nguyễn Thị Phương Thảo
Thời gian thực hiện 01/01/2019 - 31/12/2020
Tổng kinh phí 500 triệu đồng
Xếp loại Khá
Mục tiêu đề tài

Đề tài đặt mục tiêu nghiên cứu đề xuất các phương pháp xấp xỉ giải 2 bài toán tin sinh học: (1) bài toán tìm motif DNA, (2) bài toán xây dựng đồ thị tái tổ hợp tổ tiên (Ancestral Recombination Graph – ARG).

Kết quả chính của đề tài

-    Đề tài đề xuất thuật toán GAMARG kết hợp giữa ràng buộc trong kiểm thử 4 giao tử với chiến lược đoạn đầu chung dài nhất trong ARG4WG để tối ưu hóa số sự kiện tái tổ hợp trong quá trình xây dựng đồ thị ARG. Các kết quả thực nghiệm trên các tập dữ liệu khác nhau cho thấy GAMARG có thể chạy được với hàng nghìn trình tự với hàng chục nghìn SNP và có thể đạt đến ARG với số sự kiện tái tổ hợp nhỏ nhất.
-    Đề xuất thuật toán ACOSite xây dựng motif theo cách tiếp cận tối ưu hóa đàn kiến. ACOSite đã giúp cực đại một cách hiệu quả hàm IC, cho điểm F1 hứa hẹn khi so sánh với thuật toán ACOMotif và thuật toán MEME – một trong các thuật toán hàng đầu trong việc giải bài toán này.
-    Ngoài ra, chúng tôi đã thực hiện các phân tích thống kê trên dữ liệu trình tự 6 gen CYP của người Kinh Việt Nam và đã xác định được đa dạng di truyền của CYP2B6, CYP2D6 và CYP3A5 so với 6 quần thể khác từ dự án 1000 hệ gen người. Đồng thời, qua phân tích chuyển hóa thuốc ở quần thể KHV chúng tôi nhận thấy cần cẩn thận kê đơn cho các thuốc chuyển hóa CYP2C19 và CYP3A5.

Sản phẩm cụ thể giao nộp:

-    Các bài báo đã công bố (liệt kê):
01 bài hội thảo quốc tế chuyên ngành:
Nguyen Thi Phuong Thao, Le Sy Vinh, “A Hybrid Approach to Optimize the Number of Recombination in Ancestral Recombination Graphs”, In Proceedings of the 2019 9th International Conference on Bioscience, Biochemistry and Bioinformatics (pp. 36-42). ACM, 2019.

01 bài tạp chí ISI:
Diep TH, Hiep TV, Thao TPN, Nhung HTM, Kien TT, Vinh LS (2022), "Exploring the Kinh Vietnamese genomic database for the polymorphisms of the P450 genes toward precision public health", Annals of Human Biology  (https://doi.org/10.1080/03014460.2022.2052961).

-    Các sản phẩm cụ thể (mô tả sản phẩm, nơi lưu giữ):
Chương trình xây dựng đồ thị ARG – GAMARG được để dưới dạng mã nguồn mở cho cộng đồng nghiên cứu tại địa chỉ:
https://github.com/thaontp711/GAMARG

Những đóng góp mới

Đề tài đã đề xuất một thuật toán xây dựng đồ thị tái tổ hợp tổ tiên có số sự kiện tái tổ hợp đạt tới tối thiểu hoặc gần tối thiểu trên các bộ dữ liệu benchmark và có thể chạy được với dữ liệu lớn tới hàng nghìn trình tự độ dài chục nghìn SNP. Ngoài ra, kết quả phân tích 6 gen CYP trong chuyển hóa thuốc trên dữ liệu người Kinh là nền tảng bước đầu trong nghiên cứu một cách có hệ thống về các gen chuyển hóa thuốc ở Việt Nam.

Kiến nghị Tiếp tục hỗ trợ cho nghiên cứu về ứng dụng đồ thị ARG trong nghiên cứu di truyền quần thể.
Ảnh nổi bật đề tài
1657525827975-44.1.png