La reconnaissance de formes

La reconnaissance de formes ( reconnaissance de formes ) est la capacité de reconnaître un ensemble de régularités, répétitions, similitudes ou régularités de données. Cette caractéristique des systèmes cognitifs supérieurs est recherchée pour la perception humaine par les sciences cognitives telles que la psychologie perceptuelle , tandis que pour les machines, elle est étudiée par l' informatique .

Des exemples typiques pour les innombrables domaines d'application sont la reconnaissance vocale , la reconnaissance de texte et la reconnaissance faciale , des tâches que la perception humaine accomplit continuellement et évidemment sans effort. Cependant, la capacité élémentaire de classification est également la pierre angulaire de la formation de concept , de l' abstraction et de la pensée (inductive) et donc finalement de l' intelligence , de sorte que la reconnaissance de formes est également d'une importance centrale pour des domaines plus généraux tels que l' intelligence artificielle ou l'exploration de données .

Reconnaissance de formes chez l'homme

Cette capacité met de l'ordre dans le flux initialement chaotique de la perception sensorielle . La reconnaissance de formes dans la perception visuelle est de loin la meilleure étude . Leur tâche la plus importante est l'identification (et la classification ultérieure) des objets dans le monde extérieur (voir reconnaissance d'objets ).

En psychologie perceptive, une distinction est faite entre deux approches principales pour expliquer la reconnaissance de formes: les « théories de modèles » et les « théories des caractéristiques ». Les théories des modèles supposent que les objets perçus sont comparés à des objets déjà stockés dans la mémoire à long terme , tandis que les théories des caractéristiques sont basées sur l'hypothèse que les objets perçus sont analysés et identifiés en fonction de leurs «composants». Deux des théories les plus étendues des caractéristiques sont la «théorie computationnelle» de David Marr et la théorie des éléments géométriques («Geons») d' Irving Biederman .

Reconnaissance de formes en informatique

L'informatique étudie les processus qui classent automatiquement les signaux mesurés en catégories. Le point central est la reconnaissance des modèles , les caractéristiques qui sont communes à toutes les choses d'une catégorie et qui les distinguent du contenu des autres catégories. Les processus de reconnaissance de formes permettent aux ordinateurs, robots et autres machines de traiter les signaux moins précis d'un environnement naturel au lieu d'entrées précises.

Les premières approches systématiques de recherche sur la reconnaissance de formes ont vu le jour au milieu des années 1950 avec le désir de trier les livraisons de courrier par machine plutôt qu'à la main. Au fil du temps , les trois groupes actuels de processus de reconnaissance de formes ont émergé avec la reconnaissance de formes syntaxique , statistique et structurelle . L'exploitation des machines à vecteurs de support et des réseaux de neurones artificiels a été considérée comme une percée à la fin des années 1980. Bien que bon nombre des procédures standard actuelles aient été découvertes très tôt, elles ne sont devenues adaptées à un usage quotidien qu'après des améliorations méthodologiques considérables et l'augmentation générale des performances des ordinateurs disponibles dans le commerce.

approches

Aujourd'hui, une distinction est faite entre trois approches de base de la reconnaissance de formes: la reconnaissance de formes syntaxique, statistique et structurelle. Bien qu'elles soient basées sur des idées différentes, en y regardant de plus près, on reconnaît des points communs qui vont si loin qu'une méthode d'un groupe peut être transférée à une méthode de l'autre groupe sans effort significatif. Des trois approches, la reconnaissance syntaxique de formes est la plus ancienne, la statistique la plus largement utilisée et la structurelle la plus prometteuse pour l'avenir.

Syntaxiquement

Le but de la reconnaissance de formes syntaxiques est de décrire des choses en suivant des symboles de telle sorte que les objets de la même catégorie aient les mêmes descriptions. Si vous voulez séparer les pommes des bananes, vous pouvez introduire des symboles pour le rouge (R) et le jaune (G) ainsi que pour allongé (L) et sphérique (K); toutes les pommes seraient alors décrites par la séquence de symboles RK et toutes les bananes par le mot GL. Dans ce cas, le problème de la reconnaissance de formes se présente comme une recherche d'une grammaire formelle , c'est-à-dire d'un ensemble de symboles et de règles pour les combiner. Puisqu'une attribution claire entre la fonction et le symbole n'est généralement pas facilement possible, des méthodes de calcul de probabilité sont utilisées ici. Par exemple, les couleurs se déclinent en d'innombrables nuances, mais il faut faire une distinction précise entre le rouge et le jaune. Dans le cas de problèmes complexes, le problème réel n'est que retardé au lieu d'être résolu, c'est pourquoi cette approche reçoit peu d'attention et n'est utilisée que pour des tâches très claires.

Statistiquement

La plupart des méthodes standards actuelles relèvent de ce domaine, en particulier les machines vectorielles de support et les réseaux de neurones artificiels mentionnés ci-dessus . Le but ici est de déterminer la probabilité d'un objet d'appartenir à l'une ou l'autre catégorie et finalement de le trier dans la catégorie avec la probabilité la plus élevée. Au lieu d'évaluer les caractéristiques selon des règles toutes faites, elles sont simplement mesurées ici sous forme de valeurs numériques et résumées dans un soi-disant vecteur de caractéristiques . Une fonction mathématique attribue alors de manière unique une catégorie à chaque vecteur de caractéristiques imaginables. La grande force de ces méthodes est qu'elles peuvent être appliquées à presque tous les domaines et qu'aucune connaissance plus approfondie des interrelations n'est requise.

Structurellement

La reconnaissance de formes structurelles combine divers processus syntaxiques et / ou statistiques en un seul nouveau processus. Un exemple typique est la reconnaissance faciale, dans laquelle différentes méthodes de classification sont utilisées pour différentes parties du visage telles que les yeux et le nez, chacune indiquant uniquement si la partie du corps recherchée est présente ou non. Des procédures structurelles supérieures telles que les réseaux bayésiens combinent ces résultats individuels et les utilisent pour calculer le résultat global, l'affiliation de catégorie. La reconnaissance des caractéristiques de base est laissée aux processus statistiques généraux, tandis que les processus d'inférence de niveau supérieur apportent des connaissances particulières sur le sujet. Les procédures structurelles sont utilisées notamment pour des questions très complexes telles que la détection assistée par ordinateur , le diagnostic médical assisté par ordinateur.

Sous-étapes de la reconnaissance de formes

Un processus de reconnaissance de formes peut être décomposé en plusieurs sous-étapes, qui commencent par l'acquisition et à la fin une classification déterminée. Lors de l' acquisition , les données ou signaux sont enregistrés et numérisés à l' aide de capteurs . Les motifs sont obtenus à partir des signaux principalement analogiques , qui peuvent être représentés mathématiquement dans des vecteurs , appelés vecteurs de caractéristiques et matrices . Le prétraitement a lieu pour réduire les données et améliorer la qualité . Par extraction de caractéristiques, les motifs sont dans l' extraction de caractéristiques transformés ultérieurement en un espace de caractéristiques. La dimension de l'espace de représentation , dans lequel les modèles sont maintenant représentés en tant que points, est limitée aux caractéristiques essentielles pendant la fonction de réduction . La dernière étape clé est la classification par un classificateur , qui attribue les caractéristiques à différentes classes . La méthode de classification peut être basée sur un processus d'apprentissage à l'aide d'un échantillon .

Structure schématique d'un système de reconnaissance de formes

Capturer

Voir aussi : traitement du signal , mesure , numérisation et technologie de mesure

Prétraitement

Afin de mieux reconnaître les modèles, un prétraitement a généralement lieu. La suppression ou la réduction de composants de signal indésirables ou non pertinents ne conduit pas à une réduction des données à traiter; cela ne se produit que lorsque la fonction est extraite. Les méthodes de prétraitement possibles comprennent la moyenne du signal , l'application d'une valeur de seuil et la normalisation. Les résultats souhaités du prétraitement sont la réduction du bruit et la mise en correspondance avec une plage uniforme de valeurs.

Extraction de caractéristiques

Une fois que le motif a été amélioré par prétraitement, diverses caractéristiques peuvent être obtenues à partir de son signal. En règle générale, cela se fait de manière empirique selon des procédures acquises grâce à l'intuition et à l'expérience, car il existe peu de procédures purement analytiques (par exemple, la synthèse automatique de caractéristiques). Les fonctionnalités essentielles dépendent de l'application respective. Les entités peuvent être constituées de symboles ou de chaînes de symboles ou peuvent être obtenues à différents niveaux d'échelle à l' aide de méthodes statistiques . Dans les méthodes numériques, une distinction est faite entre les méthodes dans la gamme d'origine et les méthodes dans la gamme spectrale . Les fonctionnalités possibles sont, par exemple

En utilisant des transformations telles que la transformation de Fourier discrète (DFT) et la transformation en cosinus discrète (DCT), les valeurs de signal d'origine peuvent être amenées dans un espace de caractéristiques plus gérable. Les frontières entre les méthodes d'extraction de caractéristiques et de réduction de caractéristiques sont fluides. Puisqu'il est souhaitable d'obtenir le moins de caractéristiques possible, mais donc d'autant plus significatif, des relations telles que la covariance et le coefficient de corrélation entre plusieurs caractéristiques peuvent être prises en compte. Les entités peuvent être décorrélées avec la transformation Karhunen-Loève ( transformation axe principal).

Réduction des fonctionnalités

Afin de réduire les caractéristiques à celles essentielles pour la classification, il est vérifié quelles caractéristiques sont pertinentes pour la séparation des classes et lesquelles peuvent être omises. Les méthodes de réduction des caractéristiques sont l' analyse de la variance , dans laquelle il est vérifié si une ou plusieurs caractéristiques peuvent être séparées, et l' analyse discriminante , dans laquelle le plus petit nombre possible de caractéristiques non élémentaires séparables est formé en combinant des caractéristiques élémentaires.

Classification

La dernière étape essentielle de la reconnaissance de formes est la classification des entités en classes. Il existe différentes méthodes de classification à cet effet .

Les êtres vivants utilisent principalement les réseaux de neurones pour reconnaître des modèles dans les signaux de nos sens . Cette approche est analysée et imitée en bionique . La neuro-informatique a montré que les réseaux de neurones artificiels sont possibles pour l'apprentissage et la reconnaissance de modèles complexes, se déroule également de la manière indiquée ci-dessus sans d'abord une abstraction de règle.

Après la classification du motif, une tentative peut être faite pour interpréter le motif. C'est le sujet de l' analyse des patrons . Dans le traitement d'image , la classification des images peut être suivie de ce que l'on appelle la reconnaissance d'image , c'est-à-dire la simple reconnaissance d'objets dans une image sans interpréter ni analyser les relations entre ces objets.

Voir également

Littérature

  • Richard O. Duda, Peter E. Hart, David G. Stork: classification des motifs . Wiley, New York 2001, ISBN 0-471-05669-3 .
  • J. Schuermann: Classification des modèles - Une vue unifiée des approches statistiques et neuronales . Wiley, New York 1996, ISBN 0-471-13534-8 .
  • K. Fukunaga: Reconnaissance statistique des modèles . Academic Press, New York 1991, ISBN 0-12-269851-7 .
  • M. Eysenck , M. Keane: Psychologie cognitive . Psychology Press, Hove, 2000.
  • H. Niemann: Classification des modèles . Springer, Berlin 1983, ISBN 3-540-12642-2 . (en ligne ).
  • Christopher M. Bishop: Reconnaissance de formes et apprentissage automatique . Springer, Berlin 2006, ISBN 0-387-31073-8 . (en ligne ).
  • Monique Pavel: Principes de base de la reconnaissance de formes . 2e édition. Dekker, New York 1993, ISBN 0-824-78883-4 .

liens web

Preuve individuelle

  1. ^ E. Bruce Goldstein: Psychologie Perceptuelle . Spektrum Akademischer Verlag, Heidelberg 2002, ISBN 3-8274-1083-5