Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
(2022) Trang:
Tạp chí: Hội nghị Quốc gia lần thứ XV về Nghiên cứu cơ bản và ứng dụng Công Nghệ thông tin (FAIR); Hà Nội, ngày 03-04/11/2022

ABSTRACT - Imbalanced data set is a common problem when one set of classes has a significant advantage over the other. This issue causes the performance of a machine learning model to be skewed toward the majority class. This paper studies the problem of data imbalance and proposes a method of using the Generative Adversarial Network (GAN) to generate additional images for the unbalanced data set. An objective measure is required to evaluate the performance of the GAN model during the training to determine when it is good enough, i.e, determine a good configuration for generating good samples to add to a minority class. For this purpose, we propose a method of using Fréchet Inception Distance (FID) to select a good set of images from those generated from GAN. The experimentation results illustrate that the proposed method works efficiently to improve the dataset in terms of both quantity and quality, increasing the accuracy by 3%.

Keywords: Generative Adversarial Network (GAN), Imbalanced data, Frechet Inception Distance (FID).

TÓM TẮT - Tập dữ liệu mất cân bằng là khi một số lớp dữ liệu có số lượng mẫu vượt trội hơn so với các lớp khác. Bài báo này nghiên cứu vấn đề mất cân bằng dữ liệu và đề xuất một phương pháp sử dụng Mạng Đối nghịch tạo sinh (GAN) để tạo ra các hình ảnh bổ sung cho tập dữ liệu không cân bằng. Cách tiếp cận này cần có một độ đo khách quan để đánh giá trong quá trình huấn luyện GAN nhằm xác định khi nào GAN đã đủ tốt, tức là xác định được một mô hình được huấn luyện đủ tốt, có khả năng sinh ra các mẫu giống thật và đa dạng. Độ đo được đề xuất để trả lời cho vấn đề này là độ đo Fréchet Inception Distance (FID) . Thực nghiệm đã chỉ ra rằng, phương pháp lựa chọn mẫu được đề xuất có thể giúp cân bằng dữ liệu và giúp tăng độ chính xác trong nhận dạng lên 3%.

Từ khóa: Mạng Đối nghịch tạo sinh (GAN), dữ liệu không cân bằng, độ đo Fréchet Inception (FID).

 


Vietnamese | English






 
 
Vui lòng chờ...