Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
Số 25 (2013) Trang: 1-7
Tác giả: Nguyễn Cao Quí
Tải về

Thông tin chung:

Ngày nhận: 11/10/2011

Ngày chấp nhận: 25/03/2013

 

Title:

Speech recognition using hidden Markov model  on FPGA

Từ khóa:

Nhận dạng, tiếng nói, mô hình Markov ẩn, FPGA

Keywords:

Speech recognition, hidden Markov model, FPGA

ABSTRACT

Hidden Markov Model (HMM) is a statistical model, well suited for pattern recognition: speech, image, handwriting,... HMM has widely used in the last several years because of the two reasons. First it can perform with high accuracy in a wide range of application, second the model structure can be changed easily to fit practical applications.

This paper focused on studying of HMM for speech recognition and installing it on FPGA. HMM has many parameters, so choosing appropriate parameters of the model for the FPGA is included in the project. The selection is very important and must balance between time and accuracy.

TóM TắT

Mô hình Markov ẩn (HMM) là một mô hình thống kê, thích hợp ứng dụng trong việc nhận dạng mẫu: tiếng nói, hình ảnh và chữ viết? HMM được ứng dụng rộng rãi trong những năm gần đây vi hai lý do. Thứ nhất, mô hình có độ chính xác cao trong nhiều ứng dụng; Thứ hai, cấu trúc mô hình có thể thay đổi dễ dàng cho phù hợp với từng ứng dụng cụ thể.

Bài báo này tập trung nghiên cứu mô hình Markov ẩn theo hướng ứng dụng nhận dạng tiếng nói và cài đặt mô hình này lên chip FPGA. HMM có nhiều tham số, vì vậy việc lựa chọn tham số sao cho tốt nhất cũng được thực hiện trong đề tài. Việc lựa chọn này rất quan trọng, nó phải đạt được sự cân bằng giữa tốc độ xử lý và độ chính xác.

Hệ thống nhận dạng này được cài đặt trên FPGA để nhận dạng các từ đơn, số lượng từ trong bộ từ vựng có thể thay đổi nhờ khả năng có thể huấn luyện của HMM.

Do hệ thống nhận dạng này được cài đặt trên FPGA nên nó chiếm khoảng không nhỏ, thích hợp ứng dụng trong giao tiếp người-máy, robot, điều khiển bằng tiếng nói hay hỗ trợ người khuyết tật?

Các bài báo khác
11 (2017) Trang: 2370-2378
Tạp chí: IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
58 (2017) Trang: 64-73
Tạp chí: Integration, the VLSI Journal, Elsevier
 

Crossref DOI of CTUJoS


BC thường niên 2018


Con số ấn tượng (VN | EN)


Bản tin ĐHCT


TCKH tiếng Việt


TCKH tiếng Anh

 
 
Vui lòng chờ...