Thông tin Đề tài

Tên đề tài Phương pháp phân tích dữ liệu ứng dụng trong phân tích thu và nộp thuế của doanh nghiệp phục vụ thanh tra - Mã số đề tài: VAST01.08/16-17
Cơ quan chủ trì (Cơ quan thực hiện) Viện Công nghệ Thông tin
Thuộc Danh mục đề tài Hướng Công nghệ thông tin, điện tử, tự động hóa và công nghệ vũ trụ (VAST01)
Họ và tên TS. Nguyễn Long Giang
Thời gian thực hiện 01/01/2016 - 01/01/2017
Tổng kinh phí 500.000.000 đồng
Xếp loại Khá
Mục tiêu đề tài

- Nghiên cứu một số phương pháp phân tích dữ liệu sử dụng trong khai phá dữ liệu và phân tích thống kê, tập trung vào phương pháp phân lớp và hồi quy.
- Phân tích, thiết kế và xây dựng hệ thống phần mềm phân tích dữ liệu kê khai và nộp thuế nhằm tính điểm rủi ro của doanh nghiệp hỗ trợ công tác lập kế hoạch thanh tra thuế.

Kết quả chính của đề tài

Về khoa học:
- Khảo sát, phân tích và đánh giá hiện trạng các cơ sở dữ liệu và các ứng dụng tập trung tại Tổng cục thuế. Trên cơ sở đó, xác định các nguồn dữ liệu, giải pháp thu thập dữ liệu và giải pháp xây dựng hệ thống phân tích dữ liệu kê khai và nộp thuế.
- Nghiên cứu tổng quan các phương pháp thu thập và tiền xử lý dữ liệu (thu thập, tổng hợp, làm sạch, tích hợp, chuyển đổi, rời rạc hóa, rút gọn dữ liệu). Nghiên cứu, đề xuất các phương pháp mới rút gọn thuộc tính theo tiếp cận lý thuyết tập thô mờ (fuzzy rough set)
- Nghiên cứu các phương pháp phân tích dữ liệu theo hướng tiếp cận khai phá dữ liệu và học máy, tập trung vào phương pháp phân lớp, hồi quy.
- Đào tạo 02 thạc sĩ với đề tài luận văn tốt nghiệp theo hướng nghiên cứu của đề tài.
- Công bố 04 bài báo khoa học trong nội dung nghiên cứu của đề tài. Trong đó: 01 bài báo trên tạp chí CIT của Viện Hàn lâm khoa học Bulgari trong danh mục SCOPUS; 01 bài báo trên tạp chí Serdica Journal of Computing của Viện Hàn lâm khoa học Bulgari; 01 bài báo trên Chuyên san Các công trình nghiên cứu, phát triển và ứng dụng CNTT&TT; 01 bài báo trên Kỷ yếu hội thảo quốc gia “Nghiên cứu cơ bản và ứng dụng công nghệ thông tin - FAIR VI” năm 2016.
Về ứng dụng:
- Xây dựng phần mềm phân tích dữ liệu kê khai và nộp thuế nhằm tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuế. Thử nghiệm phần mềm trên dữ liệu thu, nộp thuế của một số doanh nghiệp do Cục thuế Hà nội quản lý. Phân tích và đánh giá kết quả thử nghiệm.

Một số hình ảnh cụ thể: 

nlgiang1

nlgiang2

Những đóng góp mới

Đóng góp mới của đề tài là xây dựng các phương pháp mới rút gọn thuộc tính trong giai đoạn tiền xử lý số liệu theo hướng tiếp cận lý thuyết tập thô mờ. Trên cơ sở đó, áp dụng các phương pháp đề xuất vào việc rút gọn bộ tiêu chí phân tích rủi do và xây dựng hệ thống phần mềm thử nghiệm phân tích dữ liệu kê khai và nộp thuế nhằm tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuế. Phần mềm có thể triển khai tại Cục thuế Hà Nội nhằm nâng cao hiệu quả trong công tác thanh tra thuế.

Sản phẩm đề tài

Các bài báo đã công bố (liệt kê): 01 bài báo trong tạp chí SCOPUS, 01 bài báo trong tạp chí Viện Hàn lâm khoa học Bulgari, 01 bài báo trong Chuyên san Các công trình nghiên cứu, phát triển và ứng dụng CNTT&TT, 01 bài báo trên Kỷ yếu hội thảo quốc gia.
1. C.C. Nghia, J. Demetrovics, N.L. Giang, V.D. Thi (2016), About a Fuzzy Distance Between Two Fuzzy Partitions and Application in Attribute Reduction Problem, Cybernetics and Information Technologies, SCOPUS, Sofia, Bulgarian Academy of Sciences, Vol. 16, No 4, pp. 13-28.
2. Nguyen Van Thien, Janos Demetrovics, Vu Duc Thi, Nguyen Long Giang, Nguyen Nhu Son (2016), A Method to Construct an Extension of Fuzzy Information Granularity Based on Fuzzy Distance, Serdica Journal of Computing 10, Bulgarian Academy of Sciences, Institute of Mathematics and Informatics, pp. 13-30.
3. Cao Chinh Nghia, Vu Duc Thi, Nguyen Long Giang, Tan Hanh (2016), Fuzzy distance based attribute reduction in decision tables, Chuyên san Các công trình nghiên cứu, phát triển và ứng dụng CNTT&TT, Tạp chí thông tin khoa học công nghệ của Bộ thông tin và Truyền thông, Tập V-2, số 16 (36), Tr 104-111.
4. Nguyễn Long Giang, Nguyễn Văn Thiện, Cao Chính Nghĩa (2016), Về phương pháp rút gọn thuộc tính trực tiếp trên bảng quyết định sử dụng khoảng cách mờ, Kỷ yếu Hội nghị Khoa học Công nghệ Quốc gia lần thứ IX - Nghiên cứu cơ bản và ứng dụng CNTT – FAIR9, Cần Thơ, 04-05/08/2016, Tr. 825-835.
Các sản phẩm cụ thể (mô tả sản phẩm, nơi lưu giữ)
- Báo cáo khảo sát, phân tích và đánh giá hiện trạng.
- Báo cáo khoa học về thu thập và tiền xử lý dữ liệu
- Báo cáo khoa học về phương pháp, kỹ thuật phân tích dữ liệu
- Phần mềm phân tích dữ liệu kê khai và nộp thuế
- Báo cáo kết quả thử nghiệm phần mềm
- Báo cáo tổng hợp kết quả thực hiện đề tài
- Bài báo khoa học (minh chứng trong báo cáo tổng hợp kết quả thực hiện đề tài)
- Đào tạo 03 thạc sỹ (minh chứng trong báo cáo tổng hợp kết quả thực hiện đề tài)

nlgiangy

Địa chỉ ứng dụng

Đề nghị triển khai thử nghiệm tại Cục thuế Hà Nội.