طبقه بندی تصویر مبتنی بر یادگیری انتقالی متخاصم بدون ناظر و حفظ فاصله ی بین کلاسی و درون کلاسی نمونه ها

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشگاه تبریز

2 دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز

3 دانشگاه ایستینیه

10.22034/jasp.2024.59731.1241

چکیده

در سال‌های اخیر در کاربردهای بینایی ماشین به‌طور فزاینده‌ای از تکنیک‌های یادگیری عمیق استفاده می‌شود. اما در برخی از کاربردها، به دلیل داده‌های ناکافی، مدل به‌درستی آموزش داده نمی‌شود که منجر به کاهش تعمیم‌پذیری می‌شود. به‌طوری‌که وقتی یک مدل یادگیری عمیق بر روی یک مجموعه‌داده آموزش داده می‌شود و روی مجموعه‌داده مشابه دیگری آزمایش می‌شود، این مدل نتایج تقریباً تصادفی را پیش‌بینی می‌کند. در این مقاله با هدف برطرف کردن این مشکل، از یادگیری انتقالی متخاصم بدون ناظر چندمنبعی برای افزایش تعمیم‌پذیری مدل بر روی مجموعه‌داده‌های مختلف (مبدأ و مقصد) استفاده می‌شود. در تکنیک پیشنهادی، شبکه وادار می‌شود به‌جای یادگیری ویژگی‌های مختص یک دامنه خاص، ویژگی‌های مشترک بین مجموعه‌داده‌ها‌ی مختلف (مبدأ و مقصد) را یاد بگیرد. همچنین از یک تابع خطای جدید مبتنی بر حفظ فاصله‌ی بین کلاسی‌ و درون کلاسی استفاده می‌شود. با استفاده از تابع خطای پیشنهادی، شبکه بازنمایی‌های مشابه برای نمونه‌های متعلق به یک کلاس و بازنمایی‌های غیرمشابه برای نمونه‌های متعلق به کلاس‌های مختلف را به‌طور مؤثرتر یاد می‌گیرد. ارزیابی روش پیشنهادی با بررسی سناریوهای مختلف انتقال با چهار مجموعه‌داده‌ی MNIST، MNIST-M، SVHN، و USPS انجام‌گرفته و با نتایج سایر الگوریتمهای موفق مقایسه می‌شود. دقت روش پیشنهادی به ازای مجموعه‌داده‌های MNIST، MNIST-M، SVHN، و USPS به ترتیب 99.5، 98.8، 98.5 و 98.2 درصد است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Image classification based on unsupervised adversarial transfer learning and preserving the inter-class and intra-class distance

نویسندگان [English]

  • Riram sarhan 1
  • Mohammad Ali Balafar 2
  • Mohammad Reza Feizi Derakhshi 1
  • amin Golzari Oskouei 3
1 University of Tabriz
2 Faculty of Electrical and Computer Engineering, University of Tabriz
3 İstinye university
چکیده [English]

The paper explores the growing use of deep learning in machine vision, acknowledging challenges in model generalizability due to insufficient data. To address this issue, the proposed solution employs multi-source unsupervised adversarial transfer learning, enhancing adaptability across diverse datasets. This approach compels the network to learn shared features between different datasets rather than domain-specific ones. A novel loss function is introduced, emphasizing inter-class and intra-class distance preservation. This enhances the network's ability to learn similar representations for samples within the same class and dissimilar representations for instances across different classes. Evaluation involves testing on MNIST, MNIST-M, SVHN, and USPS datasets under various transmission scenarios. Comparative analysis with other algorithms demonstrates the effectiveness of the proposed approach, achieving accuracies of 99.5%, 98.8%, 98.5%, and 98.2% for MNIST, MNIST-M, SVHN, and USPS datasets, respectively. The results highlight the solution's success in addressing insufficient data challenges and improving model generalizability in machine vision applications

کلیدواژه‌ها [English]

  • Deep learning
  • Image classification
  • Transfer learning
  • Multi-source Adversarial Domain Adaptation