Document classifiers are supervised learning models in which documents are assigned categories based on models that are trained on annotated datasets. In this paper, we use topic models to automatically assign categories to documents, which later are fed to document classification models. We perform experiments on several datasets in Vietnamese, collected from free online resources. Our method is promising and applicable to many datasets that have not been labeled
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên