Thông tin Đề tài

Tên đề tài Nghiên cứu phát triển phương pháp và công cụ trích rút tri thức dạng thông tin tóm tắt bằng ngôn ngữ trong cơ sở dữ liệu số trên cơ sở phương pháp luận đại số gia tử.
Mã số đề tài VAST01.07/17-18
Cơ quan chủ trì (Cơ quan thực hiện) Viện Công nghệ Thông tin
Thuộc Danh mục đề tài Hướng Công nghệ thông tin, điện tử, tự động hóa và công nghệ vũ trụ (VAST01)
Họ và tên TS.NCVC Nguyễn Thu Anh
Thời gian thực hiện 01/01/2017 - 31/12/2019
Tổng kinh phí 600 triệu đồng
Xếp loại Khá
Mục tiêu đề tài

Phát triển phương pháp trích rút các tóm tắt ngôn ngữ từ dữ liệu số dựa trên việc thao tác trực tiếp các từ ngôn ngữ của đại số gia tử (ĐSGT) đảm bảo độ chính xác cao và tính giải nghĩa được của hệ tri thức.
Xây dựng giải thuật và chương trình cho phép trích rút tự động các câu tóm tắt ngôn ngữ ẩn chứa trong các kho dữ liệu số phổ biến.

 

Kết quả chính của đề tài

•    Về khoa học:
Nghiên cứu phương pháp trích rút dữ liệu ngôn ngữ theo cách tiếp cận đại số  gia tử (HA) cho phép xử lý ngay trên lời nói của con người với ngữ nghĩa định tính vốn có của nó.
•    Về ứng dụng:
Xây dựng chương trình phần mềm trích rút ngôn ngữ có tính năng trích rút các tóm tắt ngôn ngữ từ dữ liệu số, ứng dụng phương pháp đã nghiên cứu. Phần mềm được phát triển để thử nghiệm phương pháp nghiên cứu nên giao diện còn đơn giản. Nếu được tiếp tục đầu tư nâng cấp thành sản phẩm hoàn thiện sẽ có thể ứng dụng trong việc cung cấp thông tin dạng ngôn ngữ  cho các cơ quan, tổ chức kinh tế - xã hội.

Những đóng góp mới

Trong nghiên cứu này, chúng tôi đã đưa ra cách tiếp cận đại số gia tử (HA) cho việc tóm tắt dữ liệu ngôn ngữ, cho phép chúng tôi xử lý các từ ngôn ngữ trực tiếp với ngữ nghĩa định tính của nó.
Áp dụng cách tiếp cận HA ở trên, chúng tôi đã đề xuất phương pháp tóm tắt ngôn ngữ mới và cài đặt chương trình thử nghiệm.

Sản phẩm đề tài

- Các bài báo đã công bố (liệt kê)

  • Cat Ho Nguyen, Thi Lan Pham, Tu Nguyen, Cam Ha Ho, ¬¬Thu Anh Nguyen The linguistic summarization and the interpretability, scalability of fuzzy representations of the word-domains’ semantic structures, Microprocessors and Microsystems, V81, March 2021.
  • Nguyen Thu Anh, Tran Thai Son The real-world-semantics interpretability of linguistic rule bases and the apporoximate reasoning method of fuzzy systems. Vietnam Journal of Science and Technology 57 (2) (2019) 233-248.
  • Thu Anh Nguyen, Cat Ho Nguyen, On the real-world-semantics interpretability of fuzzy rule based systems under fuzzy set approach and hedge algebra approach, Journal of Computer Science and Cybernetics, V.33, N.1 (2017), 86–109.

- Các sản phẩm cụ thể (mô tả sản phẩm, nơi lưu giữ) được lưu giữ tại Viện CNTT
Báo cáo khoa học về nội dung và các kết quả nghiên cứu chính.
Chương trình phần mềm trích rút ngôn ngữ: Có tính năng trích rút các tóm tắt ngôn ngữ từ dữ liệu số và tài liệu hướng dẫn sử dụng.
Đầu vào : Cơ sở dữ liệu số, dạng tri thức cần trích rút.
Đầu ra: Tri thức được trích rút từ cơ sở dữ liệu dưới dạng ngôn ngữ
- Các sản phẩm khác (nếu có)
Về đào tạo: hướng dẫn  01 thạc sĩ và 02 nghiên cứu sinh.

Ảnh nổi bật đề tài
1619497788171-thuanh.png