Thông tin Đề tài

Tên đề tài Phát triển phương pháp học sâu để ứng dụng trong bài toán phân tích và nhận dạng văn bản
Mã số đề tài VAST.01.02/19-20
Cơ quan chủ trì (Cơ quan thực hiện) Viện Công nghệ Thông tin
Thuộc Danh mục đề tài Hướng Công nghệ thông tin, điện tử, tự động hóa và công nghệ vũ trụ (VAST01)
Họ và tên TS. Nguyễn Đức Dũng
Thời gian thực hiện 01/01/2019 - 31/12/2021
Tổng kinh phí 600 triệu đồng
Xếp loại Khá
Mục tiêu đề tài

- Phát triển thuật toán nhận dạng cấu trúc văn bản mới, bao gồm cả cấu trúc vật lý (vị trí) và cấu trúc logic (định dạng) dựa trên các tiếp cận học sâu và những kết quả nghiên cứu đã có. Thuật toán mới tập trung vào việc giảm thiểu lỗi phát hiện và lỗi phân biệt/nhận dạng sai các khối dữ liệu trong trang ảnh văn bản tài liệu.
- Phát triển các thuật toán nâng cao chất lượng ảnh như khử mờ (debluring), khôi phục ảnh (restoration), phóng to (super-resolution) dựa trên mạng nơ ron tích chập (CNN) nhằm nâng cao chất lượng nhận dạng đối tượng ảnh.
- Phát triển các thuật toán nâng cao tốc độ tính toán của các mạng học sâu trong xử lý và nhận dạng đối tượng ảnh. Các thuật toán mới đảm bảo tốc độ tính toán trên máy tính phổ thông (không trang bị GPU) hay thiết bị di động.

Kết quả chính của đề tài Về khoa học: 01 Bài báo được đăng trên tạp chí Quốc tế SCIE về các phương pháp phát hiện và tách bảng trong ảnh văn bản và 01 bài báo được đăng trong hội thảo quốc gia.

Ý nghĩa khoa học: Nghiên cứu góp phần đưa ra giải pháp phát triển các phương pháp phát hiện và tách bảng trong ảnh văn bản.
Về sản phẩm: Chương trình thử nghiệm đánh giá hiệu quả của các phương pháp học sâu trong bài toán phân tích trang văn bản.
Về đào tạo: hướng dẫn 01 nghiên cứu sinh

Sản phẩm cụ thể giao nộp:

- Các bài báo đã công bố/chấp nhận đăng (liệt kê)
•    01 bài báo trên tạp chí quốc tế (Đã công bố)
Nguyen, Duc-Dung. (2022). TableSegNet: a fully convolutional network for table detection and segmentation in document images. International Journal on Document Analysis and Recognition (IJDAR). 25. 10.1007/s10032-021-00390-4. (SCIE)
•    01 bài báo trên Hội thảo quốc gia (Đã công bố)
Nguyễn Thị Thanh Nga, Nguyễn Đức Dũng, Lại Quốc Anh. Nghiên cứu ứng dụng mạng học sâu trong phân tích cấu trúc trang ảnh văn bản. Hội thảo quốc gia lần thứ XXII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông – Thái Bình, 28-29/6/2019, (tr 205-210)
- Các sản phẩm cụ thể (mô tả sản phẩm, nơi lưu giữ)
•    Các báo cáo chuyên đề, các bài báo đã công cố
•    Chương trình thử nghiệm đánh giá hiệu quả của các phương pháp học sâu trong bài toán phân tích trang văn bản.
Lưu trữ tại phòng Nhận dạng và Công nghệ tri thức- Viện Công nghệ thông tin

Ảnh nổi bật đề tài
1655277241684-39. nguyen duc dung.png