Thông tin Đề tài
Tên đề tài | Các phương pháp xấp xỉ trong hai bài toán tin sinh học: tìm motif DNA và xây dựng đồ thị ARG |
Mã số đề tài | ĐLTE00.01/19-20 |
Cơ quan chủ trì (Cơ quan thực hiện) | Viện Công nghệ Thông tin |
Thuộc Danh mục đề tài | Chương trình hỗ trợ cán bộ trẻ của Viện Hàn lâm KHCNVN |
Họ và tên | Nguyễn Thị Phương Thảo |
Thời gian thực hiện | 01/01/2019 - 31/12/2020 |
Tổng kinh phí | 500 triệu đồng |
Xếp loại | Khá |
Mục tiêu đề tài | Đề tài đặt mục tiêu nghiên cứu đề xuất các phương pháp xấp xỉ giải 2 bài toán tin sinh học: (1) bài toán tìm motif DNA, (2) bài toán xây dựng đồ thị tái tổ hợp tổ tiên (Ancestral Recombination Graph – ARG). |
Kết quả chính của đề tài | - Đề tài đề xuất thuật toán GAMARG kết hợp giữa ràng buộc trong kiểm thử 4 giao tử với chiến lược đoạn đầu chung dài nhất trong ARG4WG để tối ưu hóa số sự kiện tái tổ hợp trong quá trình xây dựng đồ thị ARG. Các kết quả thực nghiệm trên các tập dữ liệu khác nhau cho thấy GAMARG có thể chạy được với hàng nghìn trình tự với hàng chục nghìn SNP và có thể đạt đến ARG với số sự kiện tái tổ hợp nhỏ nhất. Sản phẩm cụ thể giao nộp: - Các bài báo đã công bố (liệt kê): 01 bài tạp chí ISI: - Các sản phẩm cụ thể (mô tả sản phẩm, nơi lưu giữ): |
Những đóng góp mới | Đề tài đã đề xuất một thuật toán xây dựng đồ thị tái tổ hợp tổ tiên có số sự kiện tái tổ hợp đạt tới tối thiểu hoặc gần tối thiểu trên các bộ dữ liệu benchmark và có thể chạy được với dữ liệu lớn tới hàng nghìn trình tự độ dài chục nghìn SNP. Ngoài ra, kết quả phân tích 6 gen CYP trong chuyển hóa thuốc trên dữ liệu người Kinh là nền tảng bước đầu trong nghiên cứu một cách có hệ thống về các gen chuyển hóa thuốc ở Việt Nam. |
Kiến nghị | Tiếp tục hỗ trợ cho nghiên cứu về ứng dụng đồ thị ARG trong nghiên cứu di truyền quần thể. |
Ảnh nổi bật đề tài | ![]() |