FIDLE / Présentation de saison 2023/24

Name: FIDLE / Présentation de saison 2023/24
Uploaded: 2023-11-09T14:12:20.000Z
Duration: 1 h 54 min 4 s

Introduction à la formation FIDEL

Présentation de la session

Bonjour et bienvenue au premier direct de cette nouvelle saison, avec une présentation spéciale.

Le dispositif est particulier, avec des intervenants sur deux plateaux différents grâce aux télécommunications.

L'objectif est d'explorer le programme FIDEL et de répondre aux questions du public via le chat YouTube.

Objectifs de la formation

La session interactive vise à expliquer ce qu'est FIDEL, son programme et l'environnement d'apprentissage.

FIDEL est une formation d'introduction au deep learning, un domaine en pleine expansion.

Qu'est-ce que le Deep Learning ?

Définition et portée

Le deep learning fait partie de l'apprentissage machine, centré sur les réseaux neuronaux.

Il inclut des technologies comme ChatGPT et explore les outils d'intelligence artificielle basés sur l'apprentissage machine.

Contenu du programme

Bien que le nom indique une introduction au deep learning, la formation couvre également des concepts plus larges liés à l'IA.

Les objectifs incluent découvrir, utiliser et comprendre les dernières avancées dans le domaine du deep learning.

Partenaires et soutien institutionnel

Institutions impliquées

La formation est soutenue par le CNRS, l'Institut d'intelligence artificielle MIAI de Grenoble et l'Université Grenoble Alpes.

L'Institut de développement des ressources en informatique scientifique (IDRISS), qui gère notamment un supercalculateur important pour ces recherches.

Équipe technique

Une équipe dédiée assure la maintenance du système IDRISS ainsi que le support aux utilisateurs tout au long de la formation.

Accès à la formation

Modalités d'inscription

La formation est ouverte à tous sans inscription préalable ; elle se déroule en distanciel sur YouTube.

Localisation géographique

Présentation de la Formation et des Séquences

Structure et Accessibilité des Séquences

Les séquences de formation sont interconnectées, avec une progression logique. Elles se déroulent les jeudis à 14h, durant généralement entre 2h et 3h.

La formation est gratuite et ouverte à tous, sans nécessité d'inscription préalable. Les participants peuvent également accéder aux rediffusions.

Interaction avec les Participants

Un message spécial est adressé à Alana, qui suit la formation depuis Bora Bora, soulignant l'importance de la diversité géographique des participants.

Les organisateurs encouragent l'envoi de cartes postales pour illustrer la richesse des contributions des participants.

Ressources Disponibles

Supports Pédagogiques

Tous les supports pédagogiques (PDF, notebooks pour travaux pratiques, vidéos et datasets) sont disponibles gratuitement sous licence Creative Commons.

L'équilibre entre cours théoriques et travaux pratiques est maintenu à environ 50/50 selon les sujets abordés.

Attestations de Suivi

Des attestations seront délivrées aux participants suivant les séquences en direct. Ces documents ne certifient pas un niveau mais confirment la participation.

Pour obtenir une attestation, il faut suivre le live et envoyer un mail contenant un mot clé dévoilé pendant la session.

Processus d'Obtention d'Attestations

Détails du Système d'Attestation

Le processus nécessite que le participant envoie un mail dans un délai précis après avoir reçu le mot magique pendant le live.

Un robot automatisé gère l'envoi des attestations basées sur ce mot clé envoyé par email.

Qualité Technique du Live

Présentation des formats de vidéo et prérequis pour la formation

Organisation des équipes et des plateaux

La production implique plusieurs équipes et plateaux, avec Idriss, Thib, et Camel réalisant le contenu sur un deuxième plateau.

Baptiste et Agathe gèrent les opérations techniques depuis leur emplacement dans le studio.

Différences entre formats de vidéo

Les vidéos en direct sont enregistrées et disponibles en replay sur la chaîne YouTube de Fidel.

L'ambition est d'enregistrer des séquences préenregistrées en studio pour une meilleure qualité sans les aléas du direct.

Les vidéos préenregistrées seront segmentées en séquences de 5 à 20 minutes, permettant d'approfondir les sujets abordés.

Interactivité et contraintes pédagogiques

Les sessions live maintiendront l'interaction avec le public tout en ayant une durée limitée à 2 à 3 heures.

Les séquences live permettront d'aborder certains sujets plus en profondeur selon l'intérêt du public.

Prérequis pour suivre la formation

Aucun prérequis technique n'est nécessaire ; il suffit d'assister aux séances.

La formation vise à être accessible à tous, même sans compétences informatiques ou mathématiques avancées.

Structure du programme de formation

Le programme se compose de trois grands modules : concepts fondamentaux, utilisation pratique de l'IA, et enjeux éthiques associés.

Introduction à l'utilisation de l'intelligence artificielle

Problématique scientifique et thématiques abordées

L'acronyme "Ia + x" est introduit, soulignant l'interaction entre l'intelligence artificielle et divers domaines scientifiques tels que les sciences humaines, la biologie, la physique et la chimie.

La complexité de l'intégration de l'IA dans ces thématiques est reconnue, avec des défis spécifiques liés à l'analyse, à la synthèse et à la modélisation.

Applications du Deep Learning

Le Deep Learning est présenté comme une solution potentielle pour résoudre des problèmes spécifiques rencontrés par les biologistes, physiciens et chercheurs en sciences sociales.

L'accent est mis sur le fait que cette approche vise à aider les professionnels dans leurs domaines respectifs en utilisant des outils d'IA adaptés.

Pré-requis pour participer aux sessions

Compétences nécessaires

Les participants doivent avoir une compréhension de base des concepts abordés dans la première partie ainsi qu'une maîtrise raisonnable de Python.

Il est essentiel d'être capable d'écrire et de modifier quelques lignes de code en Python pour suivre efficacement les travaux pratiques (TP).

Introduction à PyTorch

Une progression vers l'apprentissage de PyTorch sera intégrée au programme, avec un accent sur son utilisation pratique lors des TP.

Différences avec les saisons précédentes

Nouveaux parcours et contenus

La saison actuelle se distingue par un parcours axé sur les bases conceptuelles qui sera très différent des vidéos antérieures.

Bien que certains sujets soient révisés, il y aura également plusieurs nouvelles séquences ajoutées au programme.

Organisation des travaux pratiques

Structure des TP

Les TP seront majoritairement réalisés en autonomie entre les sessions, avec une présentation initiale suivie d'une phase pratique où les participants appliqueront ce qu'ils ont appris.

Temps nécessaire pour compléter les TP

Le temps requis pour maîtriser complètement un notebook dépendra du niveau d'engagement personnel; comprendre le fonctionnement peut être rapide mais écrire un notebook complet demandera plus de temps.

Appropriation du contenu

Outils et Techniques en Intelligence Artificielle

Spécialisation selon les besoins

L'intervenant évoque l'importance de choisir des outils spécifiques (CNN, DNL, Transformers) en fonction du problème scientifique à résoudre. La spécialisation est essentielle pour optimiser le temps consacré à chaque domaine.

Acteurs de l'IA et Évolution des Modèles

Discussion sur l'émergence de nouveaux acteurs dans le domaine de l'IA, notamment avec l'apparition de modèles comme GPT-4. Cela a nécessité une adaptation du discours autour des modèles de langage.

Présentation d'une séquence dédiée aux curieux souhaitant explorer les modèles de langage et multimodaux. Cette partie inclut un retour d'expérience sur le fine-tuning des modèles.

Structure du Parcours d'Apprentissage

Le parcours d'apprentissage est structuré en 20 séquences : 4 pour l'introduction, 12 pour le développement et 4 pour la conclusion. Cette structure suit un rythme poétique inspiré par la culture japonaise.

Ressources Matérielles et Accès aux GPU

Les premiers travaux pratiques (TP) peuvent être réalisés sur une machine avec CPU sans problème, mais nécessitent rapidement plus de ressources, notamment des GPU pour obtenir des résultats qualitatifs.

L'accès à des supercalculateurs est mentionné comme une solution pour les projets académiques. Ces ressources sont disponibles sous certaines conditions liées à la science ouverte.

Accessibilité et Autonomie dans l'Utilisation des Outils

Bien que les entreprises aient accès à des ressources puissantes, il reste difficile d'accéder à ces technologies individuellement. Des solutions alternatives comme Google Colab sont suggérées pour ceux qui n'ont pas accès à un GPU performant.

Pour participer efficacement au parcours "Acteur de l'IA", il est nécessaire d'avoir une maîtrise préalable en Python ainsi qu'une compréhension des modèles classiques abordés précédemment.

Avancées Récentes dans le Domaine

La discussion se concentre sur les avancées récentes dans le domaine de l'IA, soulignant que cette partie du parcours s'adresse aussi bien aux experts qu'à ceux qui souhaitent approfondir leurs connaissances.

Présentation de Panoramia et Lila

Introduction à Panoramia

Panoramia est décrit comme une revue de presse spécialisée, destinée aux experts et aux amateurs curieux.

Le magazine vidéo mensuel est diffusé sur YouTube, avec des rappels pour chaque nouvelle émission.

Structure du contenu

La progression du contenu se divise en trois parties : bases, concepts et enjeux accessibles à tous.

Après avoir abordé les bases, l'accent est mis sur l'utilisation concrète des outils face aux problématiques actuelles.

Accessibilité et Objectifs

Accessibilité des Outils

L'objectif principal est de rendre les modèles d'apprentissage automatique accessibles après la compréhension des bases.

Des illustrations seront fournies pour faciliter la compréhension, même si certains travaux pratiques nécessitent un matériel spécifique.

Travaux Pratiques

Bien que certains tests nécessitent un équipement avancé (8 à 100), il y aura des implémentations de référence disponibles.

Les travaux pratiques seront intégrés dans la partie "bases, concepts et enjeux", permettant une approche pratique sans besoin d'expertise préalable.

Détails sur le Parcours Éducatif

Découpage en Parties

Le parcours éducatif se compose de trois grandes parties qui forment un tout cohérent avec une progression logique.

Focus sur les Données

Une attention particulière sera portée sur l'importance des données dans l'intelligence artificielle, au-delà des réseaux de neurones traditionnels.

Nouvelles Séquences

Une séquence dédiée aux données sera introduite pour expliquer comment représenter le réel avec celles-ci.

Illustrations et Démonstrations

Démonstrations Pratiques

Introduction aux Technologies Avancées

Démonstration des Technologies

La présentation vise à démontrer des technologies avancées comme ChatGPT et DALL-E, en reconnaissant que le public est déjà familier avec ces outils.

La première séquence commence le 16 novembre et se termine avant les fêtes, abordant des thèmes de droit éthique et d'aspects sociétaux.

Réactualisation du Contenu

Une nouvelle version du contenu sera présentée, adaptée par rapport à l'année précédente, tout en restant accessible sur les concepts fondamentaux.

En janvier, une série de 12 séquences sera lancée pour explorer comment utiliser l'IA pour résoudre divers problèmes.

Approfondissement des Mathématiques

Équilibre dans l'Enseignement

Les mathématiques seront abordées plus en profondeur cette année, répondant aux critiques concernant leur quantité insuffisante ou excessive dans les années précédentes.

L'accent sera mis sur la méthodologie dès le début du programme, contrairement aux saisons précédentes où elle était dispersée.

Importance de la Méthodologie

La méthodologie devient essentielle pour comprendre le deep learning, intégrant des séquences sur les CNN (réseaux de neurones convolutifs), RNN (réseaux de neurones récurrents), et Transformers.

Collaboration et Diversité des Compétences

Équipe Multidisciplinaire

Le projet implique une équipe variée avec plusieurs experts afin d'aborder la diversité des compétences nécessaires dans le domaine de l'IA et du deep learning.

Des sections spécifiques seront marquées comme plus complexes, notamment celles portant sur les Transformers et les GAN (Generative Adversarial Networks).

Focus sur les Graphes Neuraux

Exploration des GNN

Une attention particulière sera portée aux Graph Neural Networks (GNN), qui permettent d'analyser des structures complexes telles que les molécules chimiques ou les réseaux sociaux.

Des sessions pratiques seront proposées pour familiariser les participants avec la théorie des graphes et ses applications concrètes.

Interrogations Futures

Un sujet intéressant concernant un "présentateur mystère" reste à clarifier; il pourrait nécessiter une approche différente par rapport à l'année précédente.

Représentation des Objets Réels en Deep Learning

Difficultés de Représentation

La principale difficulté réside dans la représentation d'objets du monde réel pour qu'ils soient traitables par des réseaux de neurones et du deep learning.

Certains objets, comme les images, sont relativement simples à numériser, mais il existe une multitude d'objets scientifiques complexes à représenter.

Types d'Objets à Représenter

Les objets incluent des molécules, systèmes atomiques, et même des réseaux sociaux qui peuvent être scientifiques ou de communication.

La complexité de la représentation est accentuée dans le domaine scientifique par rapport au monde classique.

Séquences Dédiées au Monde Scientifique

Les séquences GNN (Graph Neural Networks) et PIN (Probabilistic Inference Networks) sont spécifiquement conçues pour aborder ces défis dans le contexte scientifique.

Ces séquences se concentrent sur l'optimisation algorithmique et système, avec un accent sur les modèles émergents.

Avancées en Intelligence Artificielle

Nouveaux Modèles Émergents

Introduction de nouveaux modèles tels que ceux liés aux langages multimodaux et au segmenting.

La dernière partie du programme se concentre sur des études de cas et le retour d'expérience pratique.

Journée Deep Learning pour la Science

Une nouvelle journée dédiée au deep learning pour la science est prévue le 24 mai au CNRS à Paris.

Cet événement abordera les dernières avancées en IA appliquées à la science, bien que le programme ne soit pas encore finalisé.

Structure du Programme 2023-2024

Organisation Temporelle

Le programme sera divisé en deux parties : les quatre premières séquences jusqu'à décembre puis une seconde partie allant de janvier à début mai.

Questions Fréquemment Posées

Un participant s'interroge sur l'existence d'un projet complet d'IA englobant préparation des données, entraînement du modèle et mise en production.

Introduction à la problématique de production

Objectifs et périmètre de la formation

La formation vise à aborder la problématique depuis le point de départ jusqu'à la mise en production, bien que cette dernière ne soit pas l'objectif principal.

Il est mentionné qu'il existe d'autres formations complémentaires pour des besoins industriels spécifiques, notamment celles proposées par le CNRS ou l'Institut d'intelligence artificielle de Grenoble.

Distinction entre formation et ingénierie

La partie sur la production est davantage axée sur des problématiques d'ingénierie, qui seront intégrées dans une séquence ultérieure.

Bien que certaines thématiques industrielles soient abordées, elles ne constituent pas le cœur du programme proposé par Fidel.

Travaux pratiques et installation des environnements

Environnements proposés

Deux environnements seront proposés pour les travaux pratiques, avec un accès via le site fidel.cnrs.fr.

Le premier parcours n'exige pas d'installation préalable; il est accessible même sans compétences en Python ou informatique.

Installation et utilisation des outils

Pour le second parcours, une installation d'environnements de développement sera nécessaire pour exécuter les codes et exemples fournis.

Deux procédures sont disponibles : une manuelle utilisant PIP pour créer un environnement virtuel Python et une autre utilisant Docker pour simplifier l'installation.

Conseils pratiques pour utilisateurs Mac

Spécificités liées aux Mac M1/M2/M3

Les utilisateurs de Mac récents peuvent rencontrer des difficultés lors de l'installation des environnements. L'assistance peut être limitée en raison du manque de matériel disponible pour tester ces installations.

Résumé de la Session sur les Environnements Technologiques

Solutions et Échanges Techniques

Les participants sont encouragés à partager leurs solutions en cas de difficultés, qui seront ajoutées en ligne sur le site.

Il est suggéré d'utiliser les réseaux technologiques transverses de l'AM pour échanger sur des problèmes éventuels.

Installation et Évolution des Outils

Un utilisateur demande s'il vaut mieux reprendre l'installation depuis zéro après avoir suivi partiellement l'année précédente. La réponse indique que l'environnement a évolué.

L'année en cours marquera un changement vers PyTorch, qui est devenu dominant dans le domaine du Deep Learning.

Pré-requis et Versions de Python

Le prérequis pour le parcours 2 est une connaissance préalable de PyTorch.

Une question du chat soulève des préoccupations concernant la recommandation d'une version ancienne de Python (3.9), jugée robuste et largement utilisée.

Environnement Global et Mises à Jour

L'environnement utilisé sera le même pour toutes les séquences, avec possibilité d'installations manuelles via PIP ou Docker.

Des mises à jour seront effectuées tout au long de l'année pour corriger certains notebooks qui ne sont pas parfaits.

Conclusion et Prochaines Étapes

La prochaine session est prévue pour le 16 novembre, abordant les concepts fondamentaux du Deep Learning.