N’afficher que les événements de cette semaine
Pendant la période d'été, jusqu'au 22 août, la Cellule informatique vous accueille au bureau 225
Cet aménagement d'horaires nous permet de réaliser des opérations annuelles telles que l'inventaire des matériels informatiques qui nécessitent des déplacements dans vos bureaux dans une période où les effectifs sont réduits en raison des congés.
L'adresse help@math.u-bordeaux.fr est disponible pour toutes vos demandes. L'équipe informatique est organisée pour couvrir une permanence à distance (les jours où personne n'est sur place) jusqu'à la rentrée.
Nous vous souhaitons à tous et à toutes de passer un agréable été !
Merci de votre attention,
A définir
A définir
High-dimensional datasets, where the number of variables p is much larger than the number of samples n, are ubiquitous and often render standard classification techniques unreliable due to overfitting. An important research problem is feature selection, which ranks candidate variables based on their relevance to the outcome variable and retains those that satisfy a chosen criterion. In this presentation we propose a computationally efficient variable selection method based on principal component analysis tailored to a binary classification problem or case-control study. This method is accessible and is suitable for the analysis of high-dimensional datasets. We demonstrate the superior performance of our method through extensive simulations. A semi-real gene expression dataset, a challenging childhood acute lymphoblastic leukemia gene expression study, and a GWAS that attempts to identify single-nucleotide polymorphisms (SNPs) associated with rice grain length further demonstrate the usefulness of our method in genomic applications. We expect our method to accurately identify important features and reduce the False Discovery Rate (FDR) by accounting for the correlation between variables and by de-noising data in the training phase, which also makes it robust to mild outliers in the training data. Our method is almost as fast as univariate filters, so it allows valid statistical inference. The ability to make such inferences sets this method apart from most current multivariate statistical tools designed for today's high-dimensional data.
Un préciser
...
À préciser
TBD
A définir
...
TBD
Pour appliquer les méthodes à noyaux, nous avons besoin de noyaux faciles à calculer et suffisamment riches. Comment peut-on concevoir de "bons" noyaux sur les espaces non-euclidiens, notamment sur les espaces symétriques qui sont très récurrents dans les applications ? Nous proposons un nouveau résultat, le "théorème Lp de Godement" comme outil principal pour répondre à cette question. Nous étudions en particulier le cas des espaces symétriques qui sont des "cônes" (cônes de matrices de covariance), où la réponse trouve une forme bien concrète, avec applications à l'appui. Finalement, si on ne peut pas trouver de noyaux définis positifs, que faire ? On montrera qu'il est possible de faire beaucoup de choses avec des noyaux qui sont différence de deux noyaux définis positifs : au lieu d'apprendre dans des RKHS, on peut apprendre dans des RKKS (reproducing Kernel Krein Space).
...
TBD
Journée scientifique IA mult-disciplinaire du département SIN
TBD
A définir