Hệ thống khai thác dữ liệu sáng chế để phân tích xu hướng công nghệ
Trong khuôn khổ Chương trình Phát triển tài sản trí tuệ giai đoạn 2016-2020 (Chương trình 68) do Cục Sở hữu trí tuệ (Bộ KH&CN) quản lý, TS. Nguyễn Việt Anh, Trưởng phòng Khoa học dữ liệu và Ứng dụng và các chuyên gia trong lĩnh vực khoa học dữ liệu ở Viện Công nghệ thông tin đã được Chương trình 68 đặt hàng xây dựng “Hệ thống phân tích thực trạng, dự báo xu hướng phát triển công nghệ từ nguồn dữ liệu sáng chế và phi sáng chế” với mục tiêu có được một công cụ phân tích thông tin sáng chế ở Việt Nam.
Sau hai năm xây dựng, TS. Nguyễn Việt Anh và cộng sự đã phát triển thành công một phiên bản đầu tiên hệ thống khai thác dữ liệu sáng chế và phi sáng chế, lưu trữ gần 5 triệu tư liệu sáng chế và gần 100 triệu dữ liệu thư mục về bài báo khoa học (tài liệu phi sáng chế) từ nhiều nguồn trên thế giới. Người dùng có thể dễ dàng và nhanh chóng tra cứu theo hai cách: tìm kiếm cơ bản bằng cách gõ từ khóa hoặc tìm kiếm nâng cao theo các trường thông tin cụ thể như tên, tác giả, phân loại, ngày nộp bằng, ngày ưu tiên,...
Để xây dựng hệ thống, nhóm thực hiện đã tiến hành nghiên cứu khảo sát, đánh giá các nguồn dữ liệu hiện có trên thế giới và ở Việt Nam, tham khảo, học hỏi các hệ thống phân tích thông tin sáng chế tiên tiến của nước ngoài. Đồng thời, áp dụng những kỹ thuật tiến như trí tuệ nhân tạo, xử lý ngôn ngữ tự nhiên, xử lý dữ liệu lớn để phát triển ứng dụng. Hệ thống đã đạt được những kết quả và tính năng chính sau:
Thứ nhất, khả năng thu thập và xử lý dữ liệu lớn từ nhiều nguồn khác nhau như dữ liệu sáng chế của Cơ quan Sáng chế châu Âu (EPO), dữ liệu sáng chế của Việt Nam, dữ liệu bảo hộ sáng chế tại Việt Nam, dữ liệu các bài báo khoa học trên thế giới. Hỗ trợ tìm kiếm thông tin linh hoạt, dễ dàng và chính xác.
Thứ hai, hệ thống cung cấp các biểu đồ phân tích, đánh giá đa dạng theo nhiều chiều thông tin như thời gian, quốc gia, nhà sáng chế, nhà khoa học, các tổ chức, công ty… giúp xác định xu thế công nghệ, các sáng chế nổi bật có giá trị cao, các quốc gia và tổ chức đang dẫn dắt xu thế công nghệ, các nhà sáng chế hàng đầu trong từng lĩnh vực công nghệ.
Thứ ba, hệ thống cho phép tìm kiếm các nhà sáng chế, chủ sở hữu sáng chế có liên quan tới công nghệ người sử dụng quan tâm, nhằm xác định các đối thủ cạnh tranh tiềm năng. Các thông tin về từng đối thủ cạnh tranh được tập hợp lại tạo thành hồ sơ đối thủ cạnh tranh. Tính năng này giúp dựng lên được bức tranh toàn cảnh về hoạt động R&D trong lĩnh vực công nghệ với các thông tin kèm theo như số lượng bằng sáng chế của các đối thủ cạnh tranh, thị phần, IPC (phân loại quốc tế về sáng chế).
Thứ tư, hệ thống cho phép nhanh chóng xác định sự trùng lặp trong nội dung sáng chế, so sánh đối chiếu với sáng chế của các đối thủ cạnh tranh, xác định và đánh giá tính mới của sáng chế. Đây là tính năng đặc biệt hữu dụng đối với các chuyên gia của Cục Sở hữu trí tuệ trong việc xác định yêu cầu bảo hộ của đơn xin cấp bằng sáng chế có khả năng vi phạm các sáng chế khác hay không.
Thứ năm, hệ thống có khả năng hỗ trợ tìm kiếm kho sáng chế thế giới để giới thiệu cho các doanh nghiệp trong nước tiếp cận khai thác, đặc biệt là những công nghệ đã hết thời gian bảo hộ của nước ngoài, hoặc những công nghệ chưa đăng ký bảo hộ tại Việt Nam. Chức năng này đồng thời giúp các doanh nghiệp tránh được nguy cơ vi phạm bản quyền mà có khi tiền phạt cao gấp nhiều lần lợi nhuận.
Dự án đã thực hiện thành công và có phần vượt trội tất cả các nội dung của nhiệm vụ được giao. Sản phẩm của dự án đã trải qua nhiều vòng kiểm thử và hiện đã sẵn sàng triển khai sử dụng thực tiễn. Hệ thống có thể được ứng dụng tại các trường đại học, viện nghiên cứu, các cơ quan quản lý khoa học, các tổ chức khoa học công nghệ, các công ty, doanh nghiệp. Đối tượng người sử dụng của hệ thống rất đa dạng, bao gồm: lãnh đạo, những người làm chính sách về KH&CN, nhà sáng chế, nhà nghiên cứu, doanh nghiệp, chuyên gia sở hữu trí tuệ và bất cứ ai quan tâm đến KH&CN.
Một số vấn đề tồn tại và khả năng mở rộng hệ thống
Mặc dù hệ thống đã sẵn sàng để sử dụng trong thực tiễn, song hiện nay việc quảng bá sản phẩm để tiếp cận với các đối tượng dùng còn gặp nhiều khó khăn. Ngoài ra, để mở rộng phục vụ khách hàng còn cần đến đội ngũ kỹ sư vận hành, trợ giúp khách hàng... những công việc này đòi hỏi chi phí lớn, vượt xa nguồn lực tài chính cũng như nhân lực của nhóm nghiên cứu.
Với bất kỳ sản phẩm ứng dụng công nghệ nào, để hệ thống thực sự hoạt động tốt, cần phải có thời gian kiểm nghiệm thực tế đủ dài, giúp thu thập, phân tích thông tin phản hồi, các ý kiến đóng góp của người dùng, từ đó đưa ra các nâng cấp sửa đổi cần thiết. Bên cạnh đó, vẫn còn nhiều phần có thể nâng cấp, cải tiến, bổ sung để hệ thống có khả năng đáp ứng tốt hơn nhu cầu phân tích dự báo công nghệ.
Với các lý do chính nêu trên, nhóm thực hiện rất mong muốn tiếp tục nhận được sự hỗ trợ từ Bộ KH&CN, Chương trình Phát triển tài sản trí tuệ để tiếp tục hoàn thiện, nâng cấp, bổ sung các tính năng phân tích mới, sao cho hệ thống ngày càng đáp ứng tốt yêu cầu của người sử dụng, đồng thời tăng khả năng cạnh tranh với những sản phẩm phân tích sáng chế hàng đầu trên thế giới.