Topics in high-dimensional and non-parametric inference - Archive ouverte HAL Access content directly
Theses Year : 2022

Topics in high-dimensional and non-parametric inference

Problèmes d’inférence non-paramétrique et en grande dimension

(1)
1
Julien Chhor
  • Function : Author
  • PersonId : 1194352
  • IdRef : 265869412

Abstract

In this thesis, we consider the following topics: Local minimax testing, estimation under the combined constraints of robustness and local differential privacy, adaptive estimation in non-parametric regression with benign overfitting.A first theme addressed in this thesis is the local minimax goodness-of-fit testing problem for high-dimensional discrete distributions and Hölder-smooth densities.The problem consists in testing equality to a given distribution when observing iid data, against an alternative separated from the null distribution in some given metric. We identify the sharp non-asymptotic local minimax rates on the separation needed to ensure the existence of a uniformly consistent test and give its precise dependency on the null distribution for a variety of separation distances. We also derive the corresponding local minimax tests.In the second part of the thesis, we study an estimation problem with learning constraints. We consider the problem of estimating discrete distributions under local differential privacy, assuming also that the data follow an adversarial contamination model.We propose a locally differentially private algorithm that is robust to adversarially chosen outliers. We prove its near statistical optimality and show that it has polynomial time complexity.In the third part of the thesis, we consider the non-parametric regression setting, and we show that local polynomial estimators with singular kernel can be minimax optimal and adaptive to unknown smoothness, while continuously interpolating all the datapoints with high probability -- a phenomenon known as "benign overfitting''.
Dans cette thèse, nous traitons les sujets suivants: tests minimax locaux, estimation sous contraintes combinées de robustesse et de confidentialité locale différentielle, estimation adaptative en régression non-paramétrique avec benign overfitting.Nous étudions en premier lieu le problème de test minimax d'adéquation pour des lois discrètes et des lois à densité Hölder-régulières.Le problème consiste à tester l'égalité à une loi connue contre une alternative composée de distributions séparées de l'hypothèse nulle au sens d'une certaine métrique.Nous identifions les vitesses locales non-asymptotiques sur la séparation nécessaire pour assurer l'existence d'un test uniformément consistant et nous donnons leur dépendance précise par rapport à l'hypothèse nulle pour différentes distances de séparation.Nous identifions également les tests locaux optimaux correspondants.Nous étudions le problème d'estimation de lois discrètes avec contrainte de confidentialité differentielle locale en supposant de plus que les données sont issues d'un modèle de contamination adversariale.Nous proposons un algorithme robuste aux outliers et adapté à la confidentialité, dont nous montrons l'optimalité statistique ainsi que l'efficacité en temps de calcul.Enfin, dans le cadre de la régression non-paramétrique, nous utilisons des estimateurs par polynômes locaux avec noyau singulier afin de construire des estimateurs continus, minimax et adaptatifs à la régularité inconnue de la fonction à estimer, et qui interpolent tous les points de données avec grande probabilité - un phenomène connu sous le nom de ``benign overfitting".
Fichier principal
Vignette du fichier
114662_CHHOR_2022_diffusion.pdf (1.87 Mo) Télécharger le fichier
Origin : Version validated by the jury (STAR)

Dates and versions

tel-03872498 , version 1 (06-12-2022)

Identifiers

  • HAL Id : tel-03872498 , version 1

Cite

Julien Chhor. Topics in high-dimensional and non-parametric inference. Statistics [math.ST]. Institut Polytechnique de Paris, 2022. English. ⟨NNT : 2022IPPAG005⟩. ⟨tel-03872498⟩
0 View
0 Download

Share

Gmail Facebook Twitter LinkedIn More