HISTOIRE DE L'ANALYSE DES DONNEES



Histoire
Les pères de l’analyse des données modernes sont Jean-Paul BenzécriLouis GuttmanChikioHayashi(concepteur des méthodes dénommées « Data Sciences »), Douglas Carroll et R.N. Shepard.
Mais bien avant leur temps, les techniques de base de l'analyse des données sont déjà connues. Les tableaux de contingences, par exemple, sont présents tôt dans l'histoire : l'invincible armada est décrite, par Paz Salas et Alvarez dans un livre publié en 1588, sous la forme d'un tableau où les lignes représentent les flottes de navires et les colonnes les caractéristiques telles que le tonnage, le nombre de gens d'armes, etc. Nicolas de Lamoignon de Basville, intendant du roi Louis XIV, compte et caractérise les couvents et le monastères de la région du Languedoc en 1696.
La classification trouve son maître, entre 1735 et 1758, en la personne de Carl von Linné qui met en place à cette époque les fondements de la nomenclature binomiale et la taxinomie moderne. Robert R. Sokal et Peter H.A. Sneath présentent en 1963 des méthodes quantitatives appliquées à la taxinomie.
Les notions requises pour une analyse des données modernes commencent à être maitrisées au début du XIXe siècle. Adolphe Quetelet, astronome, statisticien belge, exploite ce qu'il connait de la loi gaussienne à l'anthropométrie pour examiner la dispersion autour de la moyenne (la variance) des mesures des tailles d'un groupe d'hommes. Puis, Francis Galton, parce qu'il veut étudier la taille des pères et des fils, s'intéresse à la variation conjointe (la covariance et la corrélation) de deux grandeurs, qui est à l'origine de ce qu'on appelle aujourd'hui la régression. Quand Karl Pearson et Raphael Weldons'emparent des travaux de Francis Galton, ils peuvent généraliser la régression de Galton aux données multidimensionnelles, puis Karl Pearson a l'idée de changer les axes de présentation pour les exprimer en fonctions de variables indépendantes en 1901, établissant ainsi les prémisses de l’analyse en composantes principales. Celle-ci est développée en 1933 par Harold Hotelling qui définit en 1936 l'Analyse canonique.
Marion Richardson et FredericKuder en 1933, cherchant à améliorer la qualité des vendeurs de« Procter & Gamble », utilisent ce qu'on appelle maintenant l'algorithme (« Reciprocal averaging »), bien connu en ACP. Herman Otto Hirschfeld, dans sa publication « A connection between correlation and contingency », découvre les équations de l'analyse des correspondances.
C'est la psychométrie qui développe le plus l'analyse des données. Quand Alfred Binet définit ses tests psychométriques pour mesurer l'intelligence chez l'enfant, Charles Spearman s'en accapare pour définir,en 1904, sa théorie des facteurs général et spécifique qui mesurent l'aptitude générale et l'aptitude particulière à une activité, nécessaires pour mener à bien cette activité. Louis Leon Thurstone met au point sous forme matricielle les équations induites par la théorie des facteurs, en 1931, et la complète par l'étude du terme d'erreur. Il introduit aussi la notion d'axes principaux d'inertie. En 1933, Harold Hotelling propose l'utilisation de l'itération pour la diagonalisation des matrices et la recherche des vecteurs propres.
Jean-Paul Benzécri et Brigitte Escofier-Cordier proposent l'Analyse factorielle des correspondances en 1962-65, mais en 1954 ChikioHayashi a déjà établi les fondations de cette méthode sous le nom Quantification de type III.
L'analyse des correspondances multiples est initiée par Louis Guttman en 1941, Cyril Burt en 1950 et à ChikioHayashi en 1956. Cette technique est développée au Japon en 1952 par ShizuhikoNishisato sous la dénomination « Dual Scaling » et aux Pays-Bas en 1990 sous le nom de « Homogeneity analysis » par le collectif Albert Gifi.
L'avènement de l'ordinateur, et surtout du micro-ordinateur, est un saut technologique qui rend possible les calculs complexes, les diagonalisations, les recherches de valeurs propres sur de grands tableaux de données, avec des délais d'obtention de résultats très courts par rapport à ce qui est fait dans le passé




Share your views...

0 Respones to "HISTOIRE DE L'ANALYSE DES DONNEES"

Enregistrer un commentaire

 

À propos de moi

Admirateurs

© 2010 STATISTIQUES POUR TOUS All Rights Reserved Converted into Blogger Template by Hack Tutors.info