Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
In Hamido Fujita · Philippe Fournier-Viger · Moonis Ali · Yinglin Wang (2022) Trang: 737-746
Tạp chí: Lecture Notes in Computer Science

Extractive text summarization is one of the most important tasks in natural language processing. In this work, we use K-Means clustering to create the clusters on the Vietnamese large-scale dataset, then use these clusters to extract the most relevant sentences on the single-document to produce the summary. At first, we collected the articles in the Vietnamese online newspapers, cleaned up and packaged them into the dataset, after that we applied our summarization model for the experimentation. The best F-Score of this model based on ROUGE-2 and ROUGE-L are 15.48% and 28.68%.

Các bài báo khác
20 (2022) Trang: 309-316
Tạp chí: Journal of information and communication convergence engineering
141 (2023) Trang: 489-501
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies
Harish Sharma, Vivek Shrivastava, Kusum Kumari Bharti, Lipo Wang (2023) Trang: 65-77
Tạp chí: Lecture Notes in Networks and Systems
1925 (2023) Trang: 273-288
Tạp chí: Communications in Computer and Information Science
(2020) Trang: 180-187
Tạp chí: Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, 2020
 


Vietnamese | English






 
 
Vui lòng chờ...