HISTOIRE DE L'ANALYSE DES DONNEES
Histoire
Les pères de l’analyse
des données modernes sont Jean-Paul Benzécri, Louis Guttman, ChikioHayashi(concepteur des méthodes
dénommées « Data Sciences »), Douglas Carroll et R.N.
Shepard.
Mais bien avant leur
temps, les techniques de base de l'analyse des données sont déjà connues. Les
tableaux de contingences, par exemple, sont présents tôt dans l'histoire :
l'invincible armada est décrite, par Paz Salas et Alvarez dans un livre publié en 1588,
sous la forme d'un tableau où les lignes représentent les flottes de navires et
les colonnes les caractéristiques telles que le tonnage, le nombre de gens
d'armes, etc. Nicolas de Lamoignon de Basville, intendant du roi Louis XIV, compte et caractérise
les couvents et le monastères de la région du Languedoc en 1696.
La classification trouve
son maître, entre 1735 et 1758, en la personne de Carl von Linné qui met en place à
cette époque les fondements de la nomenclature binomiale et la taxinomie
moderne. Robert R. Sokal et Peter H.A. Sneath présentent en 1963 des méthodes
quantitatives appliquées à la taxinomie.
Les notions requises
pour une analyse des données modernes commencent à être maitrisées au début
du XIXe siècle. Adolphe Quetelet, astronome, statisticien belge, exploite ce qu'il connait de la loi
gaussienne à l'anthropométrie pour examiner la dispersion autour de la moyenne
(la variance) des mesures des tailles d'un groupe d'hommes. Puis, Francis Galton, parce qu'il veut
étudier la taille des pères et des fils, s'intéresse à la variation conjointe
(la covariance et la corrélation) de deux grandeurs, qui est à l'origine de ce qu'on appelle aujourd'hui la
régression. Quand Karl Pearson et Raphael Weldons'emparent des travaux de Francis Galton, ils peuvent généraliser la
régression de Galton aux données multidimensionnelles, puis Karl Pearson a
l'idée de changer les axes de présentation pour les exprimer en fonctions de
variables indépendantes en 1901, établissant ainsi les prémisses de l’analyse en composantes principales. Celle-ci est développée en 1933 par Harold Hotelling qui définit en 1936 l'Analyse canonique.
Marion Richardson et
FredericKuder en 1933, cherchant à améliorer la qualité des vendeurs de« Procter
& Gamble », utilisent ce qu'on appelle maintenant l'algorithme (« Reciprocal
averaging »), bien connu en ACP. Herman Otto Hirschfeld, dans sa publication « A connection between correlation and
contingency », découvre les équations de l'analyse des
correspondances.
C'est la psychométrie qui développe le
plus l'analyse des données. Quand Alfred Binet définit ses tests
psychométriques pour mesurer l'intelligence chez l'enfant, Charles Spearman s'en accapare pour définir,en 1904, sa théorie des facteurs général
et spécifique qui mesurent l'aptitude générale et l'aptitude particulière à une
activité, nécessaires pour mener à bien cette activité. Louis Leon Thurstone met au point sous forme matricielle les équations induites par la
théorie des facteurs, en 1931, et la complète par l'étude du terme
d'erreur. Il introduit aussi la notion d'axes principaux d'inertie. En 1933,
Harold Hotelling propose l'utilisation de l'itération pour la diagonalisation
des matrices et la recherche des vecteurs propres.
Jean-Paul Benzécri
et Brigitte Escofier-Cordier proposent l'Analyse factorielle des correspondances en 1962-65, mais
en 1954 ChikioHayashi a déjà établi les fondations de cette méthode sous le nom
Quantification de type III.
L'analyse des
correspondances multiples est initiée par Louis Guttman en 1941, Cyril Burt en
1950 et à ChikioHayashi en 1956. Cette technique est développée au Japon en 1952 par ShizuhikoNishisato
sous la dénomination « Dual Scaling » et aux Pays-Bas en 1990 sous le nom
de « Homogeneity analysis » par le collectif Albert Gifi.
L'avènement de l'ordinateur, et surtout du
micro-ordinateur, est un saut technologique qui rend possible les calculs
complexes, les diagonalisations, les recherches de valeurs propres sur de
grands tableaux de données, avec des délais d'obtention de résultats très
courts par rapport à ce qui est fait dans le passé
Tags: ANALYSE DES DONNEES


Inscription à :
Publier les commentaires (Atom)
Share your views...
0 Respones to "HISTOIRE DE L'ANALYSE DES DONNEES"
Enregistrer un commentaire