Thông tin chung: Ngày nhận bài: 15/09/2017 Ngày nhận bài sửa: 10/10/2017 Ngày duyệt đăng: 20/10/2017 Title: Using class information associated with centroid to detect duplicate bug reports Từ khóa: Báo cáo lỗi, dò tìm trùng lắp, đặc điểm trọng lượng, thông tin centroid lớp Keywords: Bug reports, class centroid information, duplication detection, feature weighting | ABSTRACT This paper proposes a detection scheme of duplicate bug reports in open-source projects based on the class information associated with centroid to enhance the detection performance. This method is extended from the previous one which used only centroid method without considering the effects of both inner and inter class. Besides, this method also improved the use of normalized cosine previously for identifying the similarity between two bug reports by denormalized cosine. The effectiveness of this method is verified in an empirical study with three open-source projects, SVN, Argo UML, and Apache. The experimental results show that this method outperforms other detection schemes by about 10% in all cases. TÓM TẮT Bài báo này giới thiệu một phương pháp dò tìm những báo cáo lỗi trùng nhau trong những kho phần mềm mã nguồn mở, dựa vào thông tin lớp kết hợp với centroid để tăng cường việc thực thi dò tìm. Phương pháp này được mở rộng từ một phương pháp trước đây do họ chỉ sử dụng centroid mà không quan tâm đến sự ảnh hưởng của các nhân tố inner và inter bên trong lớp. Ngoài ra phương pháp này cũng cải tiến việc sử dụng normalized cosine trước đây cho việc đánh giá sự giống nhau giữa hai báo cáo lỗi bằng việc sử dụng denormalize cosine. Hiệu quả của phương pháp này được chứng minh thông qua việc thực nghiệm với ba dự án mã nguồn mở: SVN, Argo UML, và Apache. Kết quả thực nghiệm cho thấy phương pháp này tốt hơn các phương pháp trước đây khoảng 10% trong tất cả ba dự án. |