Séminaire d'ouverture aux informatiques et de formation

Les recherches en informatique des membres de l'équipe PASTIS sont réparties dans des domaines très variés, qui pour certains n'ont que très peu de liens apparants. Le séminaire d'ouverture aux informatiques et de formation (SOIF) a pour objectif de faire émerger des collaborations aux interfaces de ces différents domaines de recherche.
Nous accueillons également avec plaisir des présentations didactiques concernant tous les domaines de l'informatique. N'hésitez pas à contacter le responsable du séminaire (Pablo Rauzy, en écrivant à resp.soif at up8.edu) pour nous proposer une présentation.

11 avril 2024 : Xavier Pothron — #31

Xavier Pothron occupe les fonctions de généraliste CG et de superviseur CG chez Nobody Studio.

Titre : Perspectives et considérations générales sur la 3D dans l'univers du jeu vidéo et du rendu précalculé | Présentation de Nobody Studio et de la dynamique des industries culturelles et créatives (ICC) à Montpellier

Résumé :
Créé en 2020, Nobody Studio est une société coopérative initialement spécialisée dans les services de lighting et de compositing précalculés, offrant son soutien à d'autres studios. Avec le temps, Nobody Studio a élargi son spectre d'interventions pour inclure l'éclairage dans le secteur des jeux vidéo, la création d'environnements 3D, la prévisualisation/le layout, ainsi que la supervision intégrale de projets de leur conception à leur achèvement. Le studio aspire également à développer ses propres projets internes.
À travers un résumé des diverses missions réalisées au fil des années et une présentation de Nobody Studio, basé à Montpellier, nous abordons les multiples défis auxquels nous sommes confrontés en tant que graphistes, studio et acteurs de l'industrie. Il s'agit notamment des différentes productions sur lesquelles nous œuvrons actuellement, des domaines de recherche et développement sur lesquels nous avons ou sommes en train de travailler, ainsi que des réflexions engagées sur l'évolution de notre profession. Cela englobe les aspects relatifs à l'écosystème (ICC de Montpellier, Siggraph Occitanie, …), au contexte industriel (grèves dans le secteur des effets visuels, licenciements dans l'industrie du jeu vidéo, écosystème éducatif, …) ou encore aux innovations technologiques (modèles génératifs, rendu en temps réel…).

La séance aura lieu le jeudi 11 avril 2024 à 16h30. Elle se déroulera en salle MR105.

21 mars 2024 : Philippe Guillot — #30

Philippe Guillot est retraité de son poste de maître de conférences en mathématiques à Paris 8.

Titre : Le RSA est-il vraiment mort ?

Résumé :
La fin prochaine du RSA est annoncée depuis plusieurs années. En témoigne la tenue annuelle de CATACRYPT (workshop on catastrophic events related to cryptology and their possible solutions) de 2014 à 2017, faisant suite au workshop “The End of RSA” en janvier 2013 à Menlo Park en Californie.

Les craintes étaient étayées par :

  • La prochaine factorisation du RSA 1024, rendant désormais accessible cette taille de clé aux "Nation State Resources".
  • Des progrès algorithmiques laissant espérer la découverte d'un algorithme de complexité L(1/4), dans la foulée de MPQS L(1/2) et GNFS L(1/3). [ L(x) est une fonction qui quantifie les complexités entre L(0) polynomial et L(1) exponentiel. ]
  • L'advenue prochaine de l'ordinateur quantique et son fameux algorithme de Shor (1994) pour factoriser les entiers en temps et ressources quadratiques.

Des financements considérables sont dirigés vers le développement de cette machine révolutionnaire ainsi que vers la recherche de solutions cryptographiques qui y résisteraient. Pourtant, plus de dix ans après ce premier workshop, la factorisation du RSA 1024 se fait toujours attendre. Le record actuel reste plafonné depuis 2020 au RSA-250 (829 chiffres binaires) factorisé par GNFS, dont certains chercheurs affirment qu'il n'est guère en pratique plus efficace que MPQS. Les machines quantiques réelles peinent à dépasser les quelques dizaines de qubits intriqués, ce qui rend hautement spéculative leur menace sur le RSA. Les informations fiables et précises sont par ailleurs très rares en raison du secret industriel dont elles font l'objet, les annonces ressemblant davantage à des plaquettes commerciales creuses.

L'objectif de l'exposé est de présenter l'algorithmique de la factorisation des entiers en détaillant plus en profondeur le crible quadratique MPQS et l'algorithme de Shor de façon à ce que l'auditeur se fasse par lui-même une idée plus précise de la menace réelle.

La séance aura lieu le jeudi 21 mars 2024 à 16h30. Elle se déroulera en salle MR105.

30 novembre 2023 : Philippe Guillot — #29

Philippe Guillot est retraité de son poste de maître de conférences en mathématiques à Paris 8.

Titre : Le Vlisp, Le Lisp de Paris 8

Résumé :
Le département informatique de l'université de Vincennes a développé dans les années 1970 toute une famille d'interprètes LISP, appelés VLISP, V comme Vincennes, sous l'impulsion de Patrick Greussay, Harald Wertz, Françoise Balmas, et Daniel Goosens notamment. Ce travail a ensuite été poursuivi à l'INRIA par Jérôme Chailloux avec un produit commercial : Le_Lisp.
Le projet Le Vlisp, débuté à l'occasion du confinement de 2020, est pensé dans cette continuité. Il présente aujourd'hui un état d'avancement suffisant pour être présenté au département d'informatique. Nous aborderons dans cette présentation : ce qu'il est possible de faire avec, son architecture générale, son environnement de programmation, et les caractéristiques du langage. En perspective seront évoqués les projets possibles et les travaux à poursuivre concernant le développement et l'utilisation du langage.

La séance aura lieu le jeudi 30 novembre 2023 à 10h30. Elle se déroulera en salle A147.

16 novembre 2023 : Alexandros Singh — #28

Alexandros Singh est maître de conférences dans l'équipe PASTIS.

Titre : Quelques équations fonctionnelles pour des cartes

Résumé :
Le but de cet exposé exploratoire est de présenter diverses équations fonctionnelles relatives à l'énumération des cartes. En particulier, nous nous intéresserons à des questions telles que : comment ces équations sont-elles reliées et peuvent-elles être inter-dérivées par des méthodes de combinatoire ou d'algèbre différentielle ?
Cette présentation s'appuie sur des travaux en cours avec Olivier Bodini et Konstantinos Tsagkaris.

La séance aura lieu le jeudi 16 novembre 2023 à 10h30. Elle se déroulera en salle A148.

26 octobre 2023 : Louis Falissard — #27

Louis Falissard est maître de conférences dans l'équipe PASTIS.

Titre : Gros modèles de langue, sous-espaces et méthodes paramétriquement efficientes

Résumé :
L'avènement au cours des dernières années des gros modèles de langues a été la source d'une évolution considérable des applications de méthodes d'apprentissage profond en traitement automatique des langues. Ces modèles, pré-entraînés de manière non-supervisée sur des corpus de données textuelles massifs, permettent notamment l'ajustement de puissant modèles neuronaux à partir de quelques milliers, voire centaines d'observations, avec des performances de généralisation qui demandaient encore il y a quelques années plusieurs millions d'exemples.
Les méthodes dites “paramétriquement efficientes”, notamment, permettent d'ajuster ces modèles de langues en réduisant significativement leurs besoins en terme de puissance de calculs, tout en affichant des performances typiquement meilleures qu'un ajustement classique sur de petits jeux de données.
On s'interessera dans ce séminaire à présenter ces méthodes, ainsi que leur utilisation dans le cadre de la méthode des “sous espaces”, pour améliorer les capacités de généralisation et de transfert de ces modèles dans un cadre où très peu de données sont disponible pour l'entraînement du modèle (entre 50 et 500 observations).

La séance aura lieu le jeudi 26 octobre 2023 à 10h30. Elle se déroulera en salle A148.

19 octobre 2023 : Marina Seghier — #26

Marina Seghier est doctorante dans l'équipe PASTIS.

Titre : Caractérisation objective des catégories textuelles pour le TAL : classification non-supervisée basée sur des descripteurs linguistiques

Résumé :
Les systèmes développés et de plus en plus répandus aujourd'hui, sont présentés comme étant très performant pour un grand nombre de tâches. Or, les performances annoncées ne sont pas toujours celles rencontrées selon les types de ressources textuelles auxquels ces outils sont confrontés. En effet, on peut par exemple observer un différentiel de performances important entre différents types de texte pour la tâche de reconnaissance d’entités nommées (Millour et al., 2022) et d’étiquetage morpho-syntaxique. Cependant, les typologies textuelles existantes, fondées sur une classification des catégories a priori sans justification linguistique, ne permettent pas d’expliquer ce différentiel. Ce travail s’inspire des travaux de Biber, 1988 et Passonneau et al., 2014, sur la caractérisation de la variation textuelle à partir de descripteurs linguistiques. Cette étude a permis de retrouver certaines similitudes avec les dimensions des travaux précédents, et ouvre la voie à de nombreuses extensions.

La séance aura lieu le jeudi 19 octobre 2023 à 10h30. Elle se déroulera en salle A148.

14 avril 2023 : Karim Tabia — #25

Karim Tabia est maître de conférences HDR à l'Université d'Artois, où il est membre du CRIL.

Titre : Raisonnement sous incohérence : Application en gestion de contenus vidéos et en IA explicable

Résumé :
L'incertitude et l'incohérence sont deux aspects omniprésents des croyances, des connaissances et des données dans de nombreux domaines. Par conséquent, le raisonnement à partir d'informations incohérentes, généralement représentées sous forme de formules logiques, est un problème important en intelligence artificielle. Cette présentation est consacrée à quelques-unes de nos contributions au raisonnement avec des informations incohérentes illustrées sur deux applications : la gestion de contenus vidéos et  l'IA explicable. La première, abordée dans le cadre du projet européen H2020-MSCA-RISE-2015 AniAge, concerne l'interrogation de bases de données hétérogènes et massives avec des parties assertionnelles affectées par l'incertitude et éventuellement des conflits. La deuxième application traite de l'explication des modèles d'apprentissage automatique en réduisant la recherche ou l'énumération d'explications à des problèmes bien connus de calcul d'ensembles de conflits et d'ensembles de corrections et pour lesquels des outils génériques existent.

La séance aura lieu le vendredi 14 avril 2023 à 18h. Elle se déroulera à distance sur Jitsi.

13 avril 2023 : Reda Belaiche — #24

Reda Belaiche est ATER à l'Université Paris Cité.

Titre : Analyse temps réel des micro-expressions par vision artificielle

Résumé :
Les technologies de l'interaction homme machine se concentrent de plus en plus sur l'être humain, que ce soit sur son identité, ou bien sur son état physique et mental. Des progrès conséquents ont été réalisés depuis quelques décennies. Cependant l'étude des pensées et des émotions reste encore un domaine peu développé, mais qui a commencé à grandement gagner en intérêt. Dans ce domaine, l’analyse des expressions faciales est le traitement préférentiel. Contrairement aux macro-expressions, visible à l’œil, les micro-expressions sont un type d’expressions faciales involontaires, extrêmement rapides et de très faible intensité. La communauté scientifique en vision par ordinateur étudie depuis quelques années les façons de reconnaître automatiquement les micro-expressions à l’aide de cameras rapides et de programmes informatiques. Il s'agit néanmoins d'un problème difficile, de par la nature de ces micro-expressions.
À partir des dernières avancées techniques en machine learning, nous avons proposé plusieurs méthodes de reconnaissance des micro-expressions basées sur la vision tout en mettant l’accent sur la rapidité d’exécution et les faibles besoins en mémoire.

La séance aura lieu le jeudi 13 avril 2023 à 10h30. Elle se déroulera à distance sur Jitsi.

11 avril 2023 : Alexandros Singh — #23

Alexandros Singh est docteur de l'Université Sorbonne Paris Nord.

Titre : La combinatoire du lambda-calcul et des cartes : bijections et propriétés limites

Résumé :
Cet exposé concerne la combinatoire des cartes et leur interaction avec le lambda calcul linéaire. En utilisant une combinaison de nouvelles techniques bijectives et analytiques, nous explorerons la structure de grandes cartes cubiques aléatoires et de lambda-termes linéaires, en nous concentrant sur l'étude de diverses statistiques sur de tels objets, en particulier celles liées à la présence de divers motifs et leur connexion avec la dynamique de la bêta-réduction sur les termes linéaires.

La séance aura lieu le mardi 11 avril 2023 à 18h. Elle se déroulera à distance sur Jitsi.

6 avril 2023 : Mehdi Naima — #22

Mehdi Naima est post-doctorant à RWTH, Aachen, en Allemagne.

Titre : Extending Brandes algorithm to improve betweenness centrality computation in temporal graphs with discrete and continuous time

Résumé :
Betweenness centrality assesses the importance of nodes in a graph, it has been used for example in social, biological and research collaboration networks. Moreover, betweenness centrality has been used in graph partitioning and community detection in the well-known Girvan-Newan algorithm.
This centrality measure is based on the enumeration of shortest paths passing through a node. A simple approach to compute betweenness centrality for all the nodes of a static graph is to use Floyd-Warshall algorithm that runs in O(n^3). Brandes in 2001 published an algorithm that runs in O(nm + n^2 log n ) on weighted graphs,  it is still considered one of the best theoretical results on the question.
Betweenness centrality has also been extended to temporal graphs. Temporal graphs have edges that bear labels according to the time of the interactions between the nodes. Betweenness centrality has been extended to the temporal graph settings, and the notion of paths has been extended to temporal paths. We will see that we are able to deploy Brandes algorithm to its full extent and improve the running time of recent results to O(nmT + n^2Tlog(nT)). We will also discuss how Brandes algorithm can also be generalized to stream graphs which are dynamic graphs with continuous time and dynamicity on the nodes.

La séance aura lieu le jeudi 6 avril 2023 à 10h30. Elle se déroulera à distance sur Jitsi.

30 mars 2023 : Mariya Evtimova-Gardair — #21

Mariya Evtimova-Gardair est ATER en informatique à l'Université Paris 1 Panthéon-Sorbonne.

Titre : Plate-forme multilingue basée sur la connaissance pour les étudiants étrangers en tant que guide culturel et éducatif

Résumé : Cette année, le début de l'invasion russe en Ukraine a entraîné une augmentation du nombre d'étudiants ukrainiens dans les systèmes éducatifs français. Les statistiques de l'UNESCO montrent que 30.000 Ukrainiens sont entrés en France le 25 mars de cette année et que 6873 étudiants ukrainiens ont été inscrits dans le système éducatif français. Ces statistiques sont également valables pour les autres pays de l'UE. Cette vague d'étudiants étrangers a conduit à la nécessité de créer un outil qui facilitera leur intégration. Cet outil vise à faciliter le processus d'intégration des étudiants étrangers, en particulier lors de leur première année d'études à l'étranger. Cet outil numérique créera une plateforme multilingue pour un guide culturel et éducatif avec des informations pour les étudiants étrangers. Pour mettre en œuvre le projet et fournir des informations de grande valeur aux étudiants, il est nécessaire de transformer les données en connaissances multilingues en utilisant les technologies sémantiques et leur application aux algorithmes de recherche de correspondance.

La séance aura lieu le jeudi 30 mars 2023 à 10h30. Elle se déroulera en salle A148, et à distance sur Jitsi.

23 mars 2023 : Cherifa Ben Khelil — #20

Cherifa Ben Khelil est post-doc à l'Université de Tours dans le projet AAC4All.

Titre : Améliorer les modèles de prédiction de mots pour la Communication Améliorée et Alternative chez les enfants

Résumé :
La Communication Améliorée et Alternative (CAA) vise à suppléer ou remplacer la parole et/ou l'écriture pour les personnes souffrant de troubles graves de la parole et du langage. Cela concerne une grande diversité de handicaps pour lesquels il existe une gamme tout aussi large de réponses en termes d'aides techniques. Un système typique de CAA consiste en un clavier virtuel à partir duquel le texte est saisi à l'aide d'un dispositif de contrôle dédié, ainsi qu'une synthèse vocale.
Quel que soit le système considéré, la saisie de texte est lente et fatigante. Pour permettre une saisie plus rapide, deux approches complémentaires peuvent être envisagées : la sélection rapide des touches grâce à une conception optimisée des claviers, et l'économie de frappe grâce aux techniques de prédiction de mots. Les mots prédits sont affichés dans une liste de prédictions, permettant ainsi la complétion de mots et une saisie de texte plus rapide.
Les modèles de prédiction reposent sur des techniques d'apprentissage automatique. Ils sont entraînés sur de grands corpus extraits de ressources web ou de journaux et sont censés être représentatifs de la langue de communication. Cette approche soulève la question de l'adaptation de la prédiction à tous types d'utilisateurs.
Au cours du projet AAC4All (Alternative & Augmentative Communication designed for all), nous chercherons à développer des moteurs de prédictions adaptées au langage enfantin, et plus globalement qui s’adaptent à l’évolution des compétences langagières de l’utilisateur. Nous avons construit un nouveau corpus francophone dédié au langage enfantin. Cette ressource a permit l'entraînement de modèles de prédiction spécifiques qui répondent mieux aux besoins des jeunes utilisateurs. Des expériences menées sur des textes réels montrent les avantages de cette adaptation en termes d'économie de frappe. En particulier, l'amélioration observée de l'économie de frappe permet de limiter le nombre de mots prédits à afficher. Cela ouvre des opportunités pour reconsidérer l'organisation du clavier virtuel ainsi que les styles d'interaction qu'il offre.

La séance aura lieu le jeudi 23 mars 2023 à 10h30. Elle se déroulera en salle MR005 et à distance sur BBB.

9 février 2023 : Cyrielle Ndongo Ngondi — #19

Cyrielle Ndongo Ngondi est étudiante en troisième année de licence informatique.

Titre : Présentation et démonstration de “Box Area”

Résumé :
Présentation des travaux de conception et démonstration du jeu “Box Area”, dévelopé dans le cadre de mon séjour à Spelkollektivet, en Suède, financé par la Mairie de Saint-Denis et l'UFR STN (département PIF).
Description du jeu : « Votre patron n’est pas au bureau. Tous le monde s’ennuie. Qu’est ce que vous pourriez faire ? Une course dans des boites avec vos collègues ! ».

La séance aura lieu le jeudi 9 février 2023 à 10h30. Elle se déroulera en salle A148.

26 janvier 2023 : Alice Millour — #18

Alice Millour est maîtresse de conférences dans l'équipe PASTIS.

Titre : Katana and Grand Guru: the Game of Lost Words (demo)

Screenshot of the game title screenRésumé :
We present a prototype of a role playing game which allows to both 1- crowdsource lexical units (including idioms) for a language and 2- help the player improve their knowledge of the language. Our implementation of the game is focused on non-standardized languages, for which the intergenerational transmission is not as efficient as it used to be. In order to address this, we incentivize the participation of a “Grand Guru”, from whom the player needs help to fulfill their mission.

La séance aura lieu le jeudi 26 janvier 2023 à 10h30. Elle se déroulera en salle A148.

13 décembre 2022 : Benjamin Dupont — #17

Benjamin Dupont est professeur agrégé au département PIF, et membe associé de l'équipe PASTIS.

Titre : Calculs de bases par réécriture

Résumé :
Dans de nombreux contextes en algèbre ont émergé des présentations définies par des générateurs et relations diagrammatiques. L'une des questions principales dans l'étude de ces présentations est de calculer des bases de certains espaces vectoriels sous-jacents. Dans cet exposé, nous présenterons une méthode issue de la théorie de la réécriture permettant d'approcher ces problèmes. Nous introduirons les propriétés fondamentales de terminaison et de confluence pour des systèmes de réécriture de mots, et nous expliquerons comment ces deux propriétés permettent de calculer des bases dans un contexte linéaire. Nous illustrerons ces constructions sur une famille d'algèbres apparaissant en théorie des algèbres de Lie.

La séance aura lieu le mardi 13 décembre 2022 à 18h. Elle se déroulera en salle A148.

29 novembre 2022 : Mark van den Bergh — #16

Mark van den Bergh est lecturer à la Vrije Universiteit d'Amsterdam.

Titre : Nim variants

Résumé :
Combinatorial game theory provides results for the class of two-player, deterministic games with perfect information. With the aim of generalizing this theory to the class of non-perfect information games in mind, we introduce and analyze three variants of the game of Nim. In these variants, the opponent only receives partial information on the move executed by the opponent. We model the variants as games in extensive form and compute Nash equilibria for different starting configurations. For one variant, this provides a full characterization of the game. For the other variants, we prove some partial and structural results, but a full characterization remains elusive.

La séance aura lieu le mardi 29 novembre 2022 à 18h. Elle se déroulera en salle A148.

8 novembre 2022 : Stephen Obonyo — #15

Stephen Obonyo est doctorant dans l'équipe PASTIS, sous la supervision de Nicolas Jouandeau.

Titre : Designing RNA Sequences By Self-play

Résumé :
Self-play (SP) is a method in Reinforcement Learning (RL) where an agent learns from the environment by playing against itself until the policy and value functions converge. The SP-based methods have recorded state-of-the-art results in playing different computer games such as Chess, Go and Othello. In this paper, we show how the RNA sequence design problem where a sequence is designed to match a given target structure can be modelled through the SP while performing the state-value evaluation using a deep value network. Our model dubbed RNASP recorded the best and very competitive results on the benchmark RNA design datasets. This work also motivates the application of the self-play to other Computational Biology problems.

La séance aura lieu le mardi 8 novembre. Elle se déroulera en salle A148.

25 octobre 2022 : Pablo Rauzy — #14

Pablo Rauzy est maître de conférences en informatique dans l'équipe PASTIS.

Titre : Promesses et (dés)illusions : une introduction technocritique aux blockchains

Résumé :
« Une blockchain est un registre distribué et immuable dans lequel sont écrites des informations qui font consensus. ». Dans cette présentation, nous commencerons par donner du sens à cette phrase et à l’ensemble des termes qui y sont employés, en nous efforçant quand c’est nécessaire de rendre accessibles les notions informatiques (comme la décentralisation, la distribution, l’immuabilité, ou le consensus) et le fonctionnement technique des outils cryptographiques sous-jacents (comme les condensats, les signatures, ou la preuve de travail ou d’enjeu). L’objectif de cette introduction sera d’atteindre une compréhension réelle de ce qu’est une blockchain.
Ainsi équipé·es, nous discuterons ensuite de ce que les blockchains permettent effectivement d’accomplir, et donc surtout ce qu’elles ne permettent pas. Nous questionnerons alors les utilisations qui en sont proposées en nous concentrant sur des cas d’usage typiques des blockchains que nous étudierons plus en détails : les « cryptomonnaies » bien sûr, la certification de documents (avec l’exemple des diplômes), et nous mentionnerons également le cas des NFT. Cela nous permettra en conclusion de questionner de manière générale le caractère d’« innovation de rupture » que l’on associe souvent à cette technologie.

La séance aura lieu le mardi 25 octobre 2022 à 18h. Elle se déroulera en salle A148.

30 juin 2022 : Journée de fin d'année de l'équipe PASTIS — #13

Séance spéciale du séminaire SOIF où l'ensemble des non-titulaires de l'équipe sont invités à présenter leurs travaux.

Le programme de la journée (version détaillée du programme en PDF) :

  • 14h–14h30 : Accueil et café
  • 14h30–15h30 : Session stagiaires
    • Chaima Ben Salem : MetaMoi : utilisation des bones pour l’animation de modèles 3D
    • Emil Răducanu : Litte_Bot, a chatbot to bring Molière’s characters back to life
    • Jilin He : Domain-specific keyword extraction
    • Mouna Benabid : Reconnaissance Blind Chess
  • 15h30–15h45 : Pause
  • 15h45–17h15 : Session doctorant·es et ATER
    • Jean-Pascal Palus : La confiance comme posture de crédulité
    • Maroua Boudabous : Active Learning for Explicit Aspect Term Extraction for Low-resource Language: A use case of French online reviews
    • Syrine Saidi : Possibilistic preference networks toolbox
    • Oumaima El Joubari : A TDMA-based protocol for safety-related applications in VANET
  • 17h15–18h : Convivialité

La séance aura lieu le jeudi 30 juin à partir de 14h. Elle se déroulera en salle A162.

9 juin 2022 : Francesco Dolce — #12

Francesco Dolce est post-doctorant à la Faculté d'informatique de l'Université technique Tchèque, à Prague.

Titre : Playing with games and words

Résumé :
Combinatorial games are two-player games with complete and perfect information (each player knows all the possible rules and see all other's player moves), and without chance involved (no dice). In this talk we present two very simple combinatorial games – namely Nim and Wythoff's game – and discuss possible generalizations and how to use Combinatorics on Word to find winning strategies.

La séance aura lieu le jeudi 9 juin 2022 à 11h. Elle se déroulera en salle A148.

31 mai 2022 : Julien Lavauzelle — #11

Julien Lavauzelle est maître de conférences en mathématiques au LAGA et à l'Université Paris 8.

Titre : Des codes correcteurs pour le retrait confidentiel d'information

Résumé :
Le retrait confidentiel d'information (private information retrieval, PIR) est une primitive cryptographique permettant d'accéder à une information stockée à distance, sans révéler l'identité de l'information au système de stockage.
Dans cet exposé, on présentera différentes techniques pour réaliser efficacement cette primitive à l'aide de codes correcteurs. Suivant les contextes d'utilisation (faible bande passante, stockage limité, etc.), on en exposera les limites ainsi que des constructions presque optimales.

La séance aura lieu le mardi 31 mai 2022 à 14h. Elle se déroulera en salle A148.

14 avril 2022 : Jean-Pascal Palus — #10

Jean-Pascal Palus est doctorant dans l'équipe PASTIS, sous la supervision d'Adrien Revault d'Allonnes et Nicolas Jouandeau.

Titre : La confiance comme posture de crédulité

Résumé :
La « confiance » (« trust »), souvent utilisée de manière interchangeable avec la « conviction » (« confidence »), est une position doxastique décrite de multiples façons par les diverses disciplines qui ont tenté de la formaliser. Parfois décrite comme la position épistémique consistant à faire confiance à un agent ou à une proposition, parfois décrite comme l'état psychologique de celui qui fait confiance ; ce concept est néanmoins presque exclusivement décrit comme un moyen d'évaluer un degré de relation entre deux ou plusieurs entités (truster-trusties, truster-proposition) d'un point de vue objectif, ce qui se traduit par l'amalgame de notions telles que la « vérité absolue » ou la « fiabilité » dans ce qui devrait, selon nous, rester un modèle descriptif et prédictif d'adhésion et de confiance dans la valeur de vérité subjective d'une proposition.
Nous présenterons ici un aperçu transdisciplinaire de ce qui se dit sur le sujet dans la littérature et proposerons une approche basée non pas sur l'évaluation externe d'un degré de « confiance » mais sur la modélisation des processus mentaux internes de celui qui fait confiance.

La séance aura lieu le jeudi 14 avril 2022 à 18h. Elle se déroulera en salle A148.

13 décembre 2021 : Revekka Kyriakoglou — #9

Revekka Kyriakoglou est maîtresse de conférences dans l'équipe PASTIS.

Titre : Recognizable morphisms and a decision algorithm for substitutive languages

Résumé :
The concept of recognizability of morphisms originates in the paper of Martin [1] under the term: determinization.
This term was first used by Host in his paper on the Ergodic theory of Dynamical Systems [2]. The notion of recognizability came in full bloom after the interest shown by many scientists due to its numerous theoretical applications in various topics, from combinatorics on words to symbolic dynamics. A similar notion is that of circularity. The two terms are often, but not always used as synonymous. This lack of consistency in the literature could lead to confusion. In this seminar, I will present my work on the different notions of recognizability, with the main goal of proving the equivalences and indicating the differences that exist between the different definitions.
In the second part of this seminar, I will present an algorithm that allows us to describe all bispecial words of a substitutive language of a recognizable morphism, together with the set of their left and right extensions.
More precisely, given a set of words S, one can associate with every word w ∈ S its extension graph which describes the possible left and right extensions of w in S. Families of sets can be defined from the properties of the extension graph of their elements: acyclic sets, dendric sets, neutral sets, etc. In the specific case of the set of words of a substitutive language of a recognizable morphism, we show that it is decidable whether these properties are verified or not.

[1] John C. Martin. Minimal flows arising from substitutions of non-constant length. Math. Systems Theory, 7:72–82, 1973.
[2] B. Host. Valeurs propres des systèmes dynamiques définis par des substitutions de longueur variable. Ergodic Theory Dynam. Systems, 6(4):529–540, 1986.

La séance aura lieu le lundi 13 décembre 2021 à 10h30. Elle se déroulera en salle A2-215.

29 novembre 2021 : Maroua Boudabous — #8

Maroua Boudabous est doctorante dans l'équipe PASTIS, sous la supervision de Anna Pappa.

Titre : WebT-IDC : Un outil pour la création intelligente de datasets à partir du web

Résumé :
On présente WebT-IDC, un outil Web conçu pour la création intelligente de datasets, capable de construire des corpus “sans bruit” de commentaires utilisateurs portant sur différents sujets dans différentes langues, à partir de forums Web et de blogs. La méthode est basée sur un modèle d'extraction unique qui se base sur l'élément de pagination, totalement indépendant de la structure DOM. WebT-IDC est un outil holistique couvrant toutes les étapes, de la requête de l'utilisateur, l'exploration de pages Web et l'extraction de données pertinentes, à la création de corpus de texte, sans bruits, utile pour les tâches d'apprentissage statistique. WebT-IDC génère un dataset partiellement étiqueté qui reflète une vision sur les retours d'expérience des utilisateurs. Ce dataset a été utilisé pour entraîner un modèle de type BERT afin de montrer sa pertinence pour une utilisation immédiate dans la tâche d'apprentissage statistique. Les résultats montrent une grande précision dans la catégorisation de la polarité, de la langue et de la reconnaissance du produit. Le système est évalué en termes d'efficacité de filtrage du bruit et de temps de calcul ainsi que la précision et le rappel.

La séance aura lieu le lundi 29 novembre 2021 à 10h30. Elle se déroulera en salle A2-215.

22 novembre 2021 : Hanane Zerdoum — #7

Hanane Zerdoum est ATER dans l'équipe PASTIS pour l'année 2021–2022.

Titre : Problèmes de suites à somme nulle sur les groupes abéliens finis : une approche explicite

Résumé :
Les problèmes de suites à somme nulle présentent un thème de la théorie additive des nombres, aussi appelé la combinatoire additive. Parmi les quantités populaires dans la littérature de ces 25 dernières années, il y la constante de Davenport, la constante d'Erdös-Ginzburg-Ziv, la constante de Gao et la constante de Harborth d'un groupe fini. Les résultats les plus aboutis à ce sujet concernent les groupes commutatifs (structure équipée d’une loi interne commutative (l'addition), d'inverse, et d'un élément neutre pour cette opération).
Je présenterai des algorithmes performants que nous avons implémenté et qui ont permis de déterminer les valeur de plusieurs constantes dans de nombreux cas auparavant ouverts. En outre, on a pu généraliser un résultat de J.J. Zhuang et W. Schmid sur la constante d'Erdös-Ginzburg-Ziv pour les groupes de la forme Cp+1p ⊕ Cp2p est un nombre premier. En effet, l'article original excluait le cas p = 2.

La séance aura lieu le lundi 22 novembre 2021 à 10h30. Elle se déroulera en salle A2-215.

8 novembre 2021 : Philippe Guillot — #6

Philippe Guillot est maître de conférences en mathématiques retraité de Paris 8, il était affilié au LAGA.

Titre : Pour un renouveau de VLisp

Résumé :
Dès sa création en 1969, l'Université de Vincennes comportait un département d'informatique où une communauté très active, autour de Patrick Greussay, Harald Wertz, Daniel Goossens, et bien d'autres, a conçu et développé une famille interprètes Lisp très réputés. Je présenterai les caractéristiques d'une maquette qui reprend les principes des interprètes originaux tout en prenant en compte plusieurs innovations dans la continuité de MetaVlisp d'Emmanuel Saint-James. Les problèmes posés par la liaison dynamique seront exposés ainsi que leur résolution par un mécanisme complet et correct de fermetures telles qu'exposées par Briot et al. dans un article datant de 1986. L'objectif de ce travail est qu'il soit repris afin que ne soit pas perdu un travail qui a fait l'originalité et la réputation de l'informatique à l'Université Paris 8.

Le séance aura lieu le lundi 8 novembre 2021 à 10h30. Elle se déroulera en salle A148.

25 octobre 2021 : Emna Chebbi — #5

Emna Chebbi est ATER dans l'équipe PASTIS pour l'année 2021–2022.

Titre : Classification et détection des attaques dans les réseaux ad-hoc de véhicule suite à une évaluation de protocoles de routage

Résumé :
L'évolution des transports vers les véhicules autonomes nécessite des protocoles robustes offrant des garanties sur certaines de leurs propriétés. Les approches formelles permettent de fournir la preuve automatique de certaines propriétés, mais pour d'autres il est nécessaire de recourir à une preuve interactive impliquant le savoir d'un Expert. Mes travaux poursuivent l'objectif d'élaborer, dans le formalisme DEVS (Discrete Event System Specification), des modèles d'un ITS (Intelligent Transportation System) dont la simulation permettrait d'observer les propriétés, éventuellement vérifiées par une approche formelle, dans un scénario plus large et de générer sur les modèles des données susceptibles d'alimenter une boucle de preuve interactive au lieu d'un Expert. Prenant pour cible le protocole CBL-OLSR (Chain-Branch-Leaf in Optimized Link State Routing), l'approche montre comment un modèle DEVS et un modèle formel Event-B équivalents peuvent être construits à partir de la même spécification fonctionnelle d'un réseau ad-hoc où les noeuds utilisent ce protocole. Des propriétés relatives à la sûreté et à la sécurité sont introduites dans le modèle formel Event-B afin d'être vérifiées, puis une méthodologie est proposée afin de les transférer dans un modèle DEVS équivalent sous forme de contraintes, de choix ou d'observables selon des critères proposés. 
Les résultats de la simulation et de la modélisation exigent un mécanisme avancé permettant la détection des attaques dans le réseaux de communication de véhicules autonome. L'utilisation des algorithmes d'apprentissage automatique permet de détecter et de classifier ces attaques pour réaliser des actions preventives dans le but d’avoir un réseau véhiculaire autonome fiable.

La séance aura lieu le 25 octobre 2021 à 10h30. Elle se déroulera en salle A148.

17 juin 2021 : Anna Pappa — #4

Anna Pappa est maîtresse de conférences dans l'équipe PASTIS.

Titre : Construction automatique d'un lexique spécifique à un domaine à l'aide de N-grammes

Résumé :
L'enrichissement des corpus avec des caractéristiques sémantiques aide l'apprentissage automatique à évoluer vers une analyse plus profonde des données, comme la reconnaissance de concepts.
Dans cet exposé, nous présentons une méthode pour créer automatiquement un lexique de termes spécifiques à un domaine. Il permet à étiqueter partiellement avec des caractéristiques sémantiques un corpus récolté sur le Web, qui servira de dataset pour d'autres tâches de ML semi-supervisées.
Les termes sont issus de données textuelles brutes multilingues, utilisant un modèle probabiliste n-gramme et une mesure tf-idf. Étant donné un ensemble de quatre concepts de base comme la recherche, le développement, l'innovation et la conception, appliqués à vingt-sept catégories industrielles différentes, nous créons d'abord un corpus multilingue composé de descriptions et de rapports de sites Web d'entreprises.
Ensuite, nous générons un lexique de termes, selon un concept sémantique spécifique;le cas de cette étude est “l'innovation”. Les tests d'évaluation montrent une grande similitude avec un lexique construit par un expert humain.

La séance aura lieu le 17 juin 2021 à 10h. Elle se déroulera en visio sur BBB.

3 juin 2021 : Pablo Rauzy — #3

Pablo Rauzy est maître de conférences dans l'équipe PASTIS.

Titre : Vérification pratique et efficace de calcul délégué

Résumé :
La cryptographie homomorphique est utilisée lorsqu'un calcul est délégué à un tiers non fiable. On fait cependant implicitement l'hypothèse que ce tiers effectuera les calculs demandés, malgré sa supposée non-fiabilité. Cela pose des problèmes de confiance, notamment lorsque les calculs portent sur des données personnelles.
Nous proposons un moyen pratique et efficace de vérifier que le calcul délégué à un tiers correspond à la séquence d'opérations attendues, ce qui permet de réduire drastiquement le niveau de confiance nécessaire. Notre approche se base sur la technique bien connue et étudiée de l'extension modulaire. Elle n'est donc pas liée à un cryptosystème homomorphique en particulier, et n'introduit pas nouvelle construction cryptographique qui n'aurait pas encore passé l'épreuve du temps.
Nous présentons également une implémentation nommée THC (pour trustable homomorphic computation) que nous utilisons pour analyser les niveaux de sécurité et de performance en pratique. Pour illustrer sa simplicité d'utilisation, nous l'appliquons ensuite dans un système jouet de vote électronique.

La séance aura lieu le 3 juin 2021 à 10h30. Elle se déroulera en visio sur BBB.

12 mai 2021 : Nicolas Jouandeau — #2

Nicolas Jouandeau est maître de conférences HDR dans l'équipe PASTIS.

Titre : Résolution des Jeux à Information Imparfaite avec reconnaissance

Résumé :
Initiée notamment par des expérimentations d'apprentissage par renforcement profond sur des jeux vidéo ATARI, l'utilisation
combinée des algorithmes MCTS et des algorithmes d'apprentissage marque un progrès important de l'IA dans la conception de programmes dits intelligents pour la décision dans les jeux à information complète. Les résultats obtenus nécessitent cependant des ressources de calculs très importantes pour des problèmes de jeux avec des conditions idéales de modélisation. Dans l'optique de l'utilisation de ce type de solution pour des problèmes avec des conditions plus réelles, il s'agit de trouver des solutions d'apprentissage actif et de considérer les jeux à information imparfaite avec reconnaissance.

La séance aura lieu le 12 mai 2021 à 10h30. Elle se déroulera en visio sur BBB.

27 avril 2021 : Patrick Gikunda — #1

Patrick Gikunda est doctorant dans l'équipe PASTIS, sous la supervision de Nicolas Jouandeau. Il nous présentera son sujet de thèse “Effective rainfall prediction for optimal livestock production in Kenya using general Monte Carlo Tree Search algorithm” puis l'avancement de son travail.

Titre : Precipitation Forecasting with Deep Transfer Active Learning for Agricultural Adaptation

Résumé :
Weather events are defined by high dimensional data, interacting on many different spatio-temporal and chaotic dynamics. This makes weather prediction a complex and challenging task even when using state of the art numerical weather models. Many statistical models for weather prediction are either built upon human expertise in defining weather events or subjective thresholds of relevant physical variables which are not sufficient for many real world applications. Weather and climate datasets are series of data points indexed in time order with more than one time-dependent variable. Although some semi-supervised learning methods are proposed for univariate time series prediction, there are few deep learning works on multivariate time series prediction. Despite impressive performance of deep learning in many predictive tasks, training a deep learning model is highly dependent on availability of adequate labeled training data. On normal settings, it is expensive to collect and label adequate weather and climate data. In an effort to mitigate the requirement of large labeled dataset, we propose a Transfer Active Learning (TAL) method to emulate the dynamics of a general weather model that's provides forecast of relative short-range time series scale for adaptive agricultural management. Experiments using the proposed method on rainfall and several UCR multivariate datasets achieves a higher prediction accuracy than existing methods, using less training data.

La séance aura lieu le 27 avril 2021 à 14h30. Elle se déroulera en visio sur BBB.