أنظمة توصيف الصور

المؤلفون

  • د. سامر سليمان

الملخص

تعتبر عملية توصيف الصور على أنها تلك العملية التي يتم فيها توليد مجموعة من النصوص التي تقوم بتوصيف محتويات الصور والتي باتت تعتمد بصورة رئيسية على عمليات التعلم العميق. تستخدم هذه التقنية على مجال واسع في الوقت الراهن من أجل مساعدة ضعيفي البصر على التعرف على العناصر التي تتواجد أمامهم اثناء السير والتي تقوم شركة Nvidia بتطويرها. تعتبر أنظمة تصنيف الصور من نمط end-to-end Sequence-to-Sequence والتي تقوم بتحويل تسلسل من الصور والتي هي عبارة عن مجموعة من البيكسلات إلى تسلسل من الكلمات, وبالتالي فإننا بحاجة لمعالجة اللغات أو العبارات والصور الخاصة بها. من أجل القسم اللغوي, نستخدم الشبكات العصبية التكرارية RNN ونستخدم الشبكات الملتفة CNN من أجل معالجة الصور واستخراج السمات الأساسية الخاصة بها

ImgCaption

التنزيلات

منشور

2022-04-02