Phương pháp hiệu quả ngăn chặn phát tán thông tin sai lệch trên mạng xã hội
Mục tiêu của nhóm là nghiên cứu các cơ chế và mô hình lan truyền thông tin nói chung và thông tin sai lệch nói riêng trên các mạng xã hội trực tuyến. Xác định và phân tích các đặc trưng của thông tin sai lệch, các nhân tố ảnh hưởng trên mạng xã hội đóng vai trò quan trọng trong việc phát tán thông tin. Đồng thời, đề xuất các phương pháp, kỹ thuật hiệu quả giúp hạn chế lan truyền thông tin sai lệch. Tập trung vào bài toán trong đó thông tin được phát tán từ nhiều nguồn, thuộc nhiều chủ đề khác nhau, cơ chế phát tán thay đổi theo thời gian, đồng thời phải thỏa mãn các ràng buộc về chi phí ngăn chặn. Nhóm cũng xây dựng, thử nghiệm, đánh giá hiệu quả các phương pháp đề xuất trên các bộ dữ liệu mô phỏng và dữ liệu từ các mạng xã hội thực.
Đã có nhiều mô hình lan truyền thông tin được đề xuất trên thế giới, các mô hình này đã phát huy được vai trò trong nghiên cứu lý thuyết cũng như thực hành về lan truyền thông tin với rất nhiều ứng dụng khác nhau. Trong đó, có ba mô hình lan truyền được áp dụng nhiều nhất là mô hình Ngưỡng tuyến tính - mô hình ngẫu nhiên rời rạc trong đó thông tin được lan truyền theo các bước thời gian rời rạc; mô hình Bậc độc lập với đặc trưng chính là quá trình lan truyền thông tin theo từng cạnh một cách độc lập; mô hình SIR là một mô hình toán học cơ bản về dịch bệnh, được giới thiệu trong bài báo kinh điển của Kermack và McKendrick, sau đó cũng được áp dụng trong dự báo lan truyền thông tin. Đề tài này có sử dụng, kế thừa, cải tiến mô hình Ngưỡng tuyến tính và mô hình Bậc độc lập trong các nội dung nghiên cứu.
Việc hạn chế lan truyền thông tin sai lệch trên mạng xã hội được thực hiện trên cơ sở phát hiện được các con đường lan truyền thông tin (cơ chế lan truyền, sơ đồ lan truyền), sau đó phải xác định được các nút mạng trung gian đóng vai trò quan trọng trong việc phát tán để tiến hành ngăn chặn. Có nhiều kỹ thuật hạn chế lan truyền thông tin sai lệch đã được đề xuất, trong đó nổi bật là ba kỹ thuật: Kỹ thuật ngăn chặn ảnh hưởng, Kỹ thuật vô hiệu hóa người dùng hoặc tập liên kết, Kỹ thuật tẩy nhiễm thông tin.
Hình 1. Mô hình tổng thể hệ thống
Hình 2. Giao diện hệ thống
Trong đề tài này, nhóm nghiên cứu đã thực hiện theo Kỹ thuật vô hiệu hóa người dùng hoặc tập liên kết, được hiểu là trên mạng sẽ có một tập người dùng bị cô lập, thông tin sai lệch lan truyền đến trước tập nút này và dừng lại, không thể lan truyền tiếp đến các nút khác. Tập nút mạng này được xem như là hàng rào chắn, ngăn chặn lan truyền thông tin sai lệch. Cụ thể, nhóm đã sử dụng phương pháp “Tiêm vắc xin”, với 2 thuật toán: Thuật toán tham lam có cải tiến IGA và Thuật toán tham lam mở rộng GEA để ngăn chặn lan truyền thông tin sai lệch trên mạng xã hội trực tuyến với tập dữ liệu mô phỏng thử nghiệm. Cả 2 thuật toán đều được mô tả trong báo cáo khoa học về các phương pháp, kỹ thuật ngăn chặn lan truyền thông tin sai lệch trên mạng xã hội trực tuyến.
Đề tài đã xây dựng chương trình thử nghiệm ngăn chặn lan truyền thông tin sai lệch trên mạng xã hội trực tuyến. Nhóm đã tiến hành thử nghiệm, đánh giá kết quả chạy chương trình ngăn chặn lan truyền thông tin sai lệch trên mạng xã hội trực tuyến với đầu vào là các mạng xã hội thực được tinh lọc các yếu tố riêng tư.
Bên cạnh đó, nhóm đã công bố 02 bài báo khoa học liên quan đến nội dung nghiên cứu: 01 bài báo quốc tế đăng trên tạp chí Optimazation letter thuộc danh mục SCIE năm 2022 (SCIE Q1); 01 bài báo trên Chuyên san Các công trình nghiên cứu, phát triển và ứng dụng Công nghệ Thông tin và Truyền thông, tập 2021, số 2, trang 104-111, 2021.
Tổng hợp: Chu Thị Ngân, Trung tâm Thông tin - Tư liệu
Xử lý tin: Thanh Hà