Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
Số 19b (2011) Trang: 30-38
Tải về

Abstract

In this paper, we propose a new algorithm, called ArcX4-rODT (ArcX4 of random oblique decision trees) to classify gene data which have very small amount of samples in very high dimensions and noise. Our ArcX4-rODT algorithm constructs sequentially k random oblique trees so that each tree concentrates mostly on the errors produced by the previous ones. Furthermore, the hyper-plane obtained by Fisher's linear discriminant analysis is also used to perform multivariate splitting data at each internal node of the decision tree. Thus, the ArcX4-rODT can deal with very-high-dimensional data and noise. The experimental results on gene datasets from datam.i2r.a-star.edu.sg/datasets/krbd/ showed that our ArcX4-rODT algorithm outperforms randomforestofC4.5(RF-C4.5) and SVM (LibSVM).

Keywords: ArcX4, Random oblique decision tree, Linear discriminant analysis, gene classification

Title: Classification of Gene Expression using ArcX4-rODT Learning Algorithm

Tóm tắt

Trong bài viết này, chúng tôi trình bày giải thuật máy học mới ArcX4 của cây quyết định ngẫu nhiên xiên phân (ArcX4-rODT). Giải thuật ArcX4-rODT xây dựng tuần tự tập hợp cây xiên phân ngẫu nhiên, cây xây dựng sau sẽ tập trung lên các mẫu bị phân lớp sai bởi các cây trước, mỗi cây thành viên sử dụng siêu phẳng phân chia dữ liệu hiệu quả tại mỗi nút của cây dựa trên phân tích biệt lập tuyến tính. Việc xây dựng cây xiên phân ngẫu nhiên vì thế tạo cho giải thuật có khả năng làm việc tốt trên dữ liệu có số chiều lớn và nhiễu như dữ liệu gien. Kết quả thử nghiệm trên các tập dữ liệu gien từ site datam.i2r.a-star.edu.sg/datasets/krbd/ cho thấy rằng giải thuật ArcX4-rODT mới do chúng tôi đề xuất phân loại tốt hơn khi so sánh với rừng ngẫu nhiên của cây quyết định C4.5 và máy học véctơ hỗ trợ.

Từ khóa: Giải thuật ArcX4, Cây ngẫu nhiên xiên phân, Phương pháp phân tích biệt lập tuyến tính, Phân loại dữ liệu gien

Các bài báo khác
(2018) Trang:
Tạp chí: 2018 24th International Conference on Pattern Recognition (ICPR)
1 (2015) Trang:
Tạp chí: Eleventh IAPR International Workshop on Graphics Recognition – 22-23 August 2015, Nancy, France
1 (2015) Trang:
Tạp chí: Proceedings Hội thảo quốc tế (IEEE) ISBN: 978-1-4799-1805-8
1 (2015) Trang:
Tạp chí: Image Processing Theory, Tools and Applications, IPTA 2014
(2014) Trang: 259-262
Tạp chí: Treizième Colloque International Francophone sur l?écrit et le Document, CIFED 2014, Nancy, France 19-21/3/2014
 

Crossref DOI of CTUJoS


BC thường niên 2018


Con số ấn tượng (VN | EN)


Bản tin ĐHCT


TCKH tiếng Việt


TCKH tiếng Anh

 
 
Vui lòng chờ...