UpDown, une méthodologie d'identification et de caractérisation de perturbations affectant des données longitudinales
Abstract
In many scientific contexts, longitudinal observations are observed and
organized in hierarchical groups. This is the case for example for breeding data from high
throughput sensors, where measurements are automatically performed on animals distributed
in pens belonging to different batches. In these hierarchical systems, disturbances can affect
an individual or a group of individuals by changing their expected trajectories. Being able to
identify a disturbance affecting an individual or a whole group of individuals (which may
have different responses to the disturbance due to their own ‘resilience’) is often a major
issue. The UpDown method consists in using the information of all the groups or subgroups
to facilitate the detection and the characterization of disturbances (beginning, duration,
intensity) affecting the elements constituting the groups. An R package has been developed to
consider as many hierarchical levels as necessary, thus allowing to adapt to different scientific
problems. Applied on simulated data mimicking observed observations over 100 days from
pig farming systems, the UpDown method showed a sensitivity to detect disturbances at
different scales ranging from 43% at the individual level to 93% at the 3rd hierarchical level,associated with an excellent specificity at all scales (>95%). Finally, the median difference
between the estimated and theoretical beginnings and ends was less than 3 days in these
simulations. The correlation between the theoretical and simulated intensities was greater than
0.72 for the group scales
Dans de nombreux contextes scientifiques, des données longitudinales sont
observées, et organisées en groupe hiérarchique. C’est le cas notamment des données
d’élevage issues de capteur haut-débit pour lesquelles les mesures sont réalisées
automatiquement sur différents lots d’animaux répartis dans différents enclos. Dans ces
systèmes hiérarchiques, des perturbations peuvent affecter un individu ou un groupe
d’individus en modifiant la trajectoire attendue des observations. Être capable d’identifier une
perturbation affectant un individu ou un groupe d’individus (pouvant avoir des réponses
différentes due à leur ‘robustesse’ propre face à la perturbation) est souvent en enjeu majeur.
La méthode UpDown consiste à utiliser l’information à l’échelle des groupes ou des sous-
groupes pour faciliter la détection et la caractérisation des perturbations (début, durée,
intensité) qui affectent les éléments constituant les groupes. Un package R a été développé
permettant de considérer autant de niveaux hiérarchiques que nécessaire pour s’adapter à
différentes problématiques scientifiques. Appliqué sur des données simulées mimant des
observations issues de système d’élevage porcins observées sur une période de 100 jours, la
méthode UpDown a montré une sensibilité pour détecter les perturbations aux différentes
échelles allant de 43% à l’échelle individuelle jusqu’à 93% au 3eme niveau hiérarchique,
associé à une excellente spécificité à toutes les échelles (>95%). Finalement l’écart médian
entre les débuts et fin estimés et théoriques était inférieur à 3 jours. La corrélation entre les
intensités théoriques et simulées était supérieure à 0.72 pour les échelles de groupe
Origin : Files produced by the author(s)