Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
(2019) Trang: 468-475
Tạp chí: Hội nghị khoa học Quốc gia Nghiên cứu cơ bản về ứng dụng công nghệ thông tin (FAIR), Đại học Huế, 7-8/6/2019
Liên kết:

Tóm tắt văn bản là một bài toán rất được quan tâm trong lĩnh vực xử lý ngôn ngữ tự nhiên. Sản phẩm của quá trình tóm tắt văn bản thường ngắn hơn văn bản ban đầu, súc tích, nhưng vẫn giữ nguyên ý chính. Bài báo này trình bày thực nghiệm các phương pháp tóm tắt rút trích trên các văn bản tiếng Việt. Chúng tôi xây dựng tập dữ liệu gồm 150.000 bài báo được rút trích từ các trang báo mạng phổ biến ở Việt Nam. Tập dữ liệu này được dùng để đào tạo bộ từ vựng cho tiếng Việt và là tập dữ liệu mẫu dùng trong bài toán tóm tắt văn bản. Phương pháp centroid-based và mô hình GRU-RNN 2 chiều được áp dụng để xây dựng tóm tắt rút trích.

Các bài báo khác
Tran Khanh DangJosef KüngMakoto TakizawaTai M. Chung (2020) Trang: 443-451
Tạp chí: Future Data and Security Engineering. Big Data, Security and Privacy, Smart City and Industry 4.0 Applications
(2019) Trang: 110-114
Tạp chí: International Conference on Natural Language Processing and Information Retrieval, Tokushima, Japan, June 28-30, 2019
(2016) Trang: 861-870
Tác giả: Lâm Nhựt Khang
Tạp chí: FAIR, Can Tho 4-5/8/2016
(2014) Trang: 3077-3078
Tác giả: Lâm Nhựt Khang
Tạp chí: AAAI, Québec City, Québec, Canada, July 27–31, 2014
(2015) Trang: 2174-2180
Tạp chí: AAAI, Austin, Texas, USA, January 25–30, 2015,
(2014) Trang: 106-111
Tạp chí: ACL, Baltimore, Maryland, USA, June 22-27, 2014
(2014) Trang: 54-62
Tạp chí: ACL- ComputEL, Baltimore, Maryland, USA, June 22-27, 2014
(2013) Trang: 524-528
Tạp chí: The Conference of the NAACL- HLT. Atlanta, Georgia, USA. 9-14 June 2013
(2017) Trang: 1007-1014
Tạp chí: FAIR, Da Nang17-18/8/2017
 


Vietnamese | English






 
 
Vui lòng chờ...