Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
1925 (2023) Trang: 273-288
Tạp chí: Communications in Computer and Information Science

The problem of text summarization has consistently been a significant and prominent challenge for a particular language. Each language’s unique characteristics will reflect that country’s identity, culture, and nuances. This paper introduces extractive text summarization models for Vietnamese documents. Our approach concentrates on discovering appreciative and plausible models by combining ML algorithms. Namely, we investigate three potential models, including a "G-global-hard-cluster" (with GloVe), "probability-cluster" (with LDA, Latent Dirichlet Allocation), and a "soft-specific" combination between SGD (Stochastic gradient descent) and kmeans. Moreover, we also provide experimental results to evaluate the quality of the summary and the consumption time. In particular, our approaches obtain the expected results with 51.49% ROUGE-1, 17.99% ROUGE-2, and 29.25% ROUGE-L. Finally, we discuss the promising results of the proposed models.

Các bài báo khác
20 (2022) Trang: 309-316
Tạp chí: Journal of information and communication convergence engineering
141 (2023) Trang: 489-501
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies
Harish Sharma, Vivek Shrivastava, Kusum Kumari Bharti, Lipo Wang (2023) Trang: 65-77
Tạp chí: Lecture Notes in Networks and Systems
In Hamido Fujita · Philippe Fournier-Viger · Moonis Ali · Yinglin Wang (2022) Trang: 737-746
Tạp chí: Lecture Notes in Computer Science
(2020) Trang: 180-187
Tạp chí: Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, 2020
 


Vietnamese | English






 
 
Vui lòng chờ...