Survival data: 1) taking into account the measurement error of the covariate 2) non-parametric estimation of the hazard function by model slection. Application to the Hiroshima data - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Thèse Année : 2001

Survival data: 1) taking into account the measurement error of the covariate 2) non-parametric estimation of the hazard function by model slection. Application to the Hiroshima data

Données de survie

Résumé

We consider two statistical problems arising during the estimation of the hazard function of cancer death in Hiroshima. The first problem is the estimation of the hazard function when the covariate is mismeasured. In Chapter 2, only grouped data are available, and the mismeasurement of the covariate is modeled as a misclassification. An easily implemented estimation procedure based on a generalization of the least squares method is devised for estimating simultaneously the parameters of the hazard function and the misclassification probabilities. The procedure is applied for taking into account the mismeasurement of the dose of radiation in the estimation of the hazard function of solid cancer death in Hiroshima. In Chapter 3 available data are individual data. We consider a model of excess relative risk, and we assume that the covariate is measured with a Gaussian additive error. We propose an estimation criterion based on the partial log-likelihood, and we show that the estimator obtained by maximization of this criterion is consistent and asymptotically Gaussian. Our result extends to other polynomial regression functions, to the Cox model and to the log-normal error model. The second problem is the non-parametric estimation of the hazard function. We consider the model of excess relative and absolute risk and propose a non-parametric estimation of the effect of the covariate using a model selection procedure, when available data are stratified data. We approximate the function of the covariate by a collection of spline functions, and select the best one according to Akaike Information Criterion. By the same way we choose which model between the model of excess relative risk or excess absolute risk fits the best the data. We apply our method for estimating the solid cancer and leukemia death hazard functions in Hiroshima.
Nous considérons deux problèmes statistiques liés à l'estimation du risque de cancer des survivants d'Hiroshima. Le premier problème est l'estimation de la fonction de risque instantané quand une covariable est sujette à une erreur de mesure. Dans le chapitre 2, les données disponibles sont des données groupées. Nous supposons que l'erreur de mesure est une erreur de mauvais classement dans des intervalles et nous estimons simultanément les paramètres du risque instantané d'un modèle à risque proportionnel et les probabilités de mauvais classement. La méthode proposée est une généralisation de la méthode des moindres carrés. Nous l'appliquons aux données d'Hiroshima pour prendre en compte l'erreur de mesure de la dose de rayonnement ionisant dans l'estimation du risque de cancer. Dans le chapitre 3 les données disponibles sont les données individuelles. Nous considérons un modèle d'excès de risque relatif où la covariable est mesurée à une erreur additive gaussienne près. Nous construisons un critère d'estimation, basé sur la pseudo-vraisemblance et nous proposons un estimateur du paramètre de régression consistant et asymptotiquement gaussien. Le résultat est étendu à d'autres modélisations du risque ainsi qu'au modèle d'erreur log-normale. Le second problème est l'estimation non-paramétrique de la fonction de risque instantané par une procédure de sélection de modèle. Nous considérons une collection suffisamment riche de fonctions pour approcher le risque instantané et nous sélectionnons la meilleure fonction selon un critère pénalisé qui réalise le meilleur compromis entre la qualité de l'approximation du modèle statistique aux données, et le nombre de paramètres du modèle. Cette méthode permet d'estimer le risque instantané sans avoir à poser d'à priori sur sa forme. Nous l'appliquons pour estimer le risque de cancer induit par une faible dose de rayonnement ionisant.
Fichier non déposé

Dates et versions

tel-02832527 , version 1 (07-06-2020)

Identifiants

  • HAL Id : tel-02832527 , version 1
  • PRODINRA : 178544

Citer

Marie-Laure Martin. Survival data: 1) taking into account the measurement error of the covariate 2) non-parametric estimation of the hazard function by model slection. Application to the Hiroshima data: 1) Prise en compte d'une erreur de mesure de la covariable 2) Estimation non-paramétrique du risque par sélection de modèle. Application aux données d'Hiroshima. Life Sciences [q-bio]. 2001. English. ⟨NNT : ⟩. ⟨tel-02832527⟩

Collections

INRA INRAE MATHNUM
4 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More