Programme > Conférences plénières

Philippe Grosjean

Philippe Grosjean

Service d’Écologie numérique, Instituts Infortech et Complexys, Université de Mons, Belgique
BioDataScience-Courselogo_github_7.pnglogo_github_7.png
 

Apprendre R et les statistiques... grâce à R


Un apprenant est confronté à plusieurs difficultés lorsqu'il débute dans l'analyse de ses données avec R. Il doit maîtriser un environnement logiciel, un langage de programmation, mais aussi les concepts statistiques sous-jacents. Il doit également apprendre à bien formuler ses questions et à interpréter les résultats obtenus.

Dans le cadre du cours de Science des Données biologiques à l'Université de Mons en Belgique, nous avons développé une approche graduelle qui met en œuvre des outils pédagogiques variés existants (comme {learnr}, {gradethis}, {quarto} ou {ghclass}/GitHub Classroom), mais aussi originaux : {learnitdown} et {learnitgrid}. Nous verrons comment ces différents packages R contribuent à créer un matériel pédagogique interactif et évolutif. Il permet un voyage initiatique qui débute dans un cours en ligne (https://wp.sciviews.org), se poursuit avec des tutoriels {learnr}, pour finalement aborder des projets GitHub/Quarto cadrés avec {learnitgrid}. Au bout du voyage, les étudiants sont capables d'analyser leurs données de manière autonome et de bien communiquer leurs résultats.

Romain Lesur

Romain Lesur

INSEE
logo_github_7.pngLinkedIn
 

Comment tirer parti des technologies cloud sans se faire enfermer ? le projet Onyxia


 


EliseMaigne

Elise Maigné

MIAT, INRAE, Toulouse
 

SK8 : Pour des applications Shiny qui se déploient comme sur des roulettes


Là où le développement d'applications est rendu aujourd'hui accessible à toute personne faisant du R via Shiny, leur hébergement reste quant à lui souvent plus compliqué. Selon la solution envisagée et l'équipe qui l'entoure il faudra sûrement au développeur Shiny des compétences supplémentaires, un peu d'admin sys par ci, un peu de dev ops par là et un ensemble de bonnes pratiques de développement qui ne sont pas toujours connues, rendant des applications difficilement maintenables à long terme.

A INRAE nous avons ouvert un service d'hébergement d'applications Shiny qui se veut facile d'utilisation dans lequel nous proposons une prise en charge des aspects reproductibilité et gestion de l'environnement logiciel. Après un rapide tour d'horizon des solutions d'hébergement possibles et une présentation du service SK8, je vous expliquerai dans cet exposé ce que nous avons mis en place - et qui peut être réutilisé plus largement - pour accompagner nos utilisateurs pour rendre leurs applications Shiny robustes, reproductibles... destinées à se déployer comme sur des roulettes !


rhian_davies.jpg

Cécile Proust Lima

Inserm, Univ. Bordeaux
logo_page_web_10.jpeglogo_github_7.png
 

Modélisation conjointe de données longitudinales et de temps d'événements sous R


Les études en santé impliquent généralement la collecte de variables mesurées de manière répétée au fil du temps. Cela inclut des expositions (e.g., traitement, pression artérielle, nutrition), des marqueurs de progression (e.g., volumes cérébraux, marqueurs sanguins, taille des tumeurs, score de qualité de vie) et des délais jusqu'à des événements cliniques (e.g., décès, diagnostic, rechute). L'analyse jointe de ces données longitudinales et de ces temps d'événement se fait par des modèles dits conjoints qui prennent en compte la corrélation entre les processus en jeu[1]. Les modèles conjoints sont devenus au fil des ans un outil essentiel en biostatistique car ils permettent d'aborder diverses questions prédictives, descriptives et analytiques. Cela inclut la prédiction du risque d'événement basée sur des marqueurs ou expositions mesurés de manière répétée au fil du temps, la modélisation de la progression de marqueurs tout en tenant compte d’une sortie d'étude informative, ou la description et compréhension de la structure d'interdépendance qui peut exister entre plusieurs processus. Dans cette présentation, je vais introduire le principe de la modélisation jointe et décrire différentes approches proposées dans la littérature en m'appuyant sur les solutions R associées. Seront abordés les modèles à effets aléatoires partagés pour lesquels divers packages R existent (e.g., JM[1], JMbayes[2], INLAjoint[2]), les modèles à classes latentes avec le package lcmm[3,4], ainsi qu'une alternative aux modèles conjoints via des forêts aléatoires de survie avec le package DynForest [5,6].

Résumés au format pdf avec la bibliographie


RaillardNicolas

Nicolas Raillard

Laboratoire Hydrodynamique Marine, Ifremer, Brest
LinkedInGithub
 

R pour l'océano-météo et l’ingénierie marine


 Ces dernières années, les zones côtières ont fait l'objet d'une attention accrue, avec le développement accéléré des activités humaines d'une part, et le réchauffement climatique d'autre part, qui expose les populations vivant dans les zones côtières à des risques côtiers plus fréquents et plus intenses. Ces deux problématiques ont en commun la nécessité de bien connaître les conditions de mer à proximité des côtes, afin de qualifier précisément les risques auxquels les personnes et les structures sont exposées, un objectif pour lequel la modélisation statistique est particulièrement bien adaptée, et donc l'utilisation de R est très répandue. Dans cette présentation, nous nous concentrerons sur les structures marines, qui sont soumises aux effets combinés du vent, des vagues et des courants. Dans un premier temps, nous présenterons les données disponibles et les travaux menés à l'IFREMER pour acquérir de nouvelles données et connaissances. Dans un deuxième temps, nous présenterons les apports de la modélisation statistique pour préciser les conditions opérationnelles de ces structures, ainsi que les conditions extrêmes impactant leur conception en présentant les packages R que j'utilise au quotidien.

Personnes connectées : 2 Vie privée
Chargement...