Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
Số Công nghệ TT 2017 (2017) Trang: 133-139
Tải về

Thông tin chung:

Ngày nhận bài: 15/09/2017
Ngày nhận bài sửa: 10/10/2017

Ngày duyệt đăng: 20/10/2017

 

Title:

Learning lightweight ontology from glossary

Từ khóa:

Bảng chú giải, biểu thức chính quy, ontology, tự động, WordNet

Keywords:

Glossary, learning, ontology, WordNet, regular expression

ABSTRACT

Ontology is an advanced knowledge representation formalism. It allows reusing and sharing vocabularies between applications and plays an important role in Semantic Web. However, ontology development is complicated and time-consuming. Therefore, in this paper, an approach to constructing lightweight ontology from glossary and the WordNet was proposed. This approach based on linguistics techniques such as regular expression and Link Grammar. The experiment on the Internet Movie Database glossary showed a promising result that the proposed approach produced an ontology with more than 600 concepts and 200 relationships. However, the results still existed some limitations that required further improvements.

TÓM TẮT

Ontology là một hình thức biểu diễn tri thức cho phép chia sẻ giữa các ứng dụng và đóng vai trò rất quan trọng đối với web ngữ nghĩa. Việc xây dựng ontology thủ công tương đối phức tạp và mất thời gian. Do đó, trong nghiên cứu này, chúng tôi đề xuất một phương pháp xây dựng một ontology gọn nhẹ (light-weighted ontology) dựa trên bảng chú giải (glossary) kết hợp với cơ sở dữ liệu từ vựng WordNet và một số kỹ thuật trong xử lý ngôn ngữ tự nhiên như biểu thức chính quy, Link Grammar. Phương pháp này được thực nghiệm trên tập dữ liệu IMDB và đã xây dựng được một ontology với hơn 600 khái niệm và 200 quan hệ giữa các khái niệm. Kết quả cho thấy phương pháp được đề xuất là khả thi, cho phép xác định các khái niệm và một số quan hệ giữa chúng. Tuy nhiên, phương pháp vẫn còn một số hạn chế như phát hiện thiếu một số quan hệ giữa các khái niệm, đòi hỏi phải có thêm một số cải tiến khác để đạt được độ chính xác cao hơn.

Trích dẫn: Trần Công Án, Tống Thị Ngọc Mai và Lê Thị Thu Lan, 2017. Xây dựng ontology tự động từ bảng chú giải. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên đề: Công nghệ thông tin: 133-139.

Các bài báo khác
Số 47 (2016) Trang: 47-58
Tải về
Số Công nghệ TT 2017 (2017) Trang: 65-71
Tải về
17 (2019) Trang: 1-8
Tạp chí: EAI Endorsed Transactions on Context-aware Systems and Applications
(2017) Trang: 10-15
Tạp chí: The International Conference on Advanced COMPuting and Applications (ACOMP)
18(64) (2017) Trang: 1-34
Tạp chí: Journal of Machine Learning Research
Volume 168 (2016) Trang: 52-61
Tạp chí: Nature of Computation and Communication
(2014) Trang: 82 - 87
Tác giả: Trần Công Án
Tạp chí: Hội thào một số vấn để chọn lọc của CNTT & Truyền thông - Buôn Ma Thuộc, Đắk Lắk, 30-31/10/2014
11 (2015) Trang: 7-12
Tác giả: Trần Công Án
Tạp chí: The 2015 IEEE-RIVF International Conference on Computing and Communication Technologies
15 (2013) Trang: 22-28
Tạp chí: Space, Time and Ambient Intelligence 2013 (STAMI 2013), Washington USA. July 14?18, 2013
1 (2012) Trang: 302
Tác giả: Trần Công Án
Tạp chí: Research and Applications
25 (2012) Trang: 443
Tác giả: Trần Công Án
Tạp chí: Machine Learning Research
1 (2012) Trang: 144
Tác giả: Trần Công Án
Tạp chí: ICOST 10
1 (2012) Trang: 302
Tạp chí: 6th International Symposium, RuleML 2012
443 (2012) Trang: 25
Tạp chí: Workshop and Conference Proceedings
1 (2010) Trang: 144
Tạp chí: 8th International Conference on Smart Homes and Health Telematics, ICOST 2010
2 (2010) Trang: 211
Tác giả: Trần Công Án
Tạp chí:  Journal of Ambient Intelligence and Smart Environment
 

CTUJoS indexed by Crossref

Vietnamese | English


BC thường niên 2018


Con số ấn tượng (VN | EN)


Bản tin ĐHCT


TCKH tiếng Việt


TCKH tiếng Anh

 
 
Vui lòng chờ...