Optimal Matching and Social Sciences - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2006

Optimal Matching and Social Sciences

Résumé

This working paper is a reflection on the conditions required to use optimal matching (OM) in social sciences. Despite its striking success in biology, optimal matching was not invented to solve biological questions but computer science ones: OM is a family of distance concepts originating in information and coding theory were it is known under various names among which Hamming, and Levenshtein distance. As a consequence, the success of this method in biology has nothing to do with the alleged similarity of the way it operates with biological processes but with choices of parameters in accordance with the kind of materials and questions biologists are facing. As materials and questions differ in social sciences, it is not possible to import OM directly from biology. The very basic fact that sequences of social events are not made of biological matter but of events and time is crucial for the adaptation of OM: insertion and deletion operations warp time and are to be avoided if information regarding the social regulation of the timing of event is to be fully recovered. A formulation of substitution costs taking advantage of the social structuration of time is proposed for sequences sharing the same calendar: dynamic substitution costs can be derived from the series of transition matrices describing social sub-rhythms. An application to the question of the scheduling of work is proposed: using data from the 1985-86 and 1998-99 French time-use surveys, twelve types of workdays are uncovered. Their interpretability and quality, assessed visually through aggregate and individual tempograms, and box plots, seem satisfactory.
Ce document de travail se veut une réflexion sur les conditions d'utilisation des méthodes d'appariement optimal en sciences sociales. En dépit de ses succès retentissant en biologie, l'appariement optimal n'a pas été inventé pour résoudre des problèmes en biologie mais en informatique et en théorie du codage où il est connu notamment sous les noms de distance de Hamming et de Levenshtein. Par conséquent, le succès de cette méthode en biologie n'a rien à voir avec la possible ressemblance de son mode opératoire avec des processus biologiques mais provient de choix de paramètres cohérents avec le type de matériel et de questions auxquels les biologistes font face. Parce qu'en sciences sociales les séquences sont composées d'événements et de temps, les succès obtenus en biologie ne peuvent être importés directement. En particulier, les opérations d'insertion et de suppression distordent l'échelle temporelle et doivent être évitées dès lors que l'objectif de l'analyse est de repérer la régulation sociale du timing des événements. Une formulation des coûts de substitution tirant profit de la structure sociale du temps est proposée pour les séquences qui partagent le même calendrier : des coûts de substitution dynamiques peuvent être dérivés de la série de matrices de transitions qui décrit les sous rythmes. Une application à la question des rythmes de travail est proposée : douze types de journées de travail sont identifiés dans les enquêtes sur l'emploi du temps réalisées par l'Insee en 1985-86 et 1998-99. Leurs interprétabilité et qualité, visuellement évaluées au travers de chronogrammes agrégés et individuels et de diagrammes à surfaces, apparaît satisfaisante.
Fichier principal
Vignette du fichier
Lesnard_2006-Optimal_Matching_and_Social_Sciences-p.pdf (1004.18 Ko) Télécharger le fichier

Dates et versions

halshs-00008122 , version 1 (24-01-2006)

Identifiants

  • HAL Id : halshs-00008122 , version 1

Citer

Laurent Lesnard. Optimal Matching and Social Sciences. 2006. ⟨halshs-00008122⟩
717 Consultations
3851 Téléchargements

Partager

Gmail Facebook X LinkedIn More