Résumé:
Le travail présenté dans cette thèse prend sa place dans les domaines de la vision par ordinateur et du traitement de la vidéo. Il fournit quelques idées et contributions aux méthodes et applications de détection, de suivi et comptage d’objets. L’objectif principal de cette thèse était la proposition de nouveaux algorithmes pour accomplir la détection, le comptage et le suivi d’objets en se basant sur les méthodologies récentes de l’intelligence artificielle.
Ainsi, dans une première contribution, nous avons proposé un modèle fiable et efficace pour la détection et le suivi d’objets multiples en s’appuyant sur les approches modernes de l’apprentissage profond. Un modèle avec deux algorithmes pour le comptage et le filtrage d’objets a été proposé, il constitue notre deuxième contribution. Dans ce modèle, nous avons utilisé la méthode du flux optique généré entre les trames vidéo pour prédire les situations des objets avec un réseau CNN récent et efficace de l’apprentissage profond, nommé Center Net (Zhou et al., 2019) employé pour la détection de ces objets.
Dans une dernière contribution, nous avons formulé le suivi visuel d’objets par le déplacement du centre de l’objet cible en se référant à la direction du vecteur du flux optique et au réseau Center Net pour la correction des coordonnées de l’objet suivi. D’abord, le déplacement optique du centre est utilisé pour détecter le centre possible de la boîte englobante de l’objet suivi. Ensuite, le réseau Center Net est utilisé pour corriger la position de l’objet cible. L’intégration des deux techniques précédentes a donné un modèle robuste aux variations de l’apparence des objets causées par des changements importants de la forme, la déformation et le mouvement rapide. Deux algorithmes ont été présentés pour la formulation proposée avec une analyse expérimentale détaillée. Les résultats expérimentaux ont montré, en général, que les approches et algorithmes proposés pour détecter, suivre et compter les objets dans les vidéos offrent de très bonnes performances et exactitudes et même égalent aux certaines méthodes de la littérature de la vision par ordinateur et de l’apprentissage profond.