anglais francais
google shcolar reasearch gate HAL

dvp linkedin w3c

foaf skype facebook

rateActor

checksem ucd le2i

Domaines de recherche

Publications

Revues internationales

Conférences internationales

Livres

Responsabilités

Comité de lecture

Projets en cours


SADFC

Thématiques de recherche

Criminalistique informatique, Web Sémantique, Intelligence Artificielle

Recherche et objectifs

La cybercriminalité est un phénomène prenant de l’importance de nos jours et un nombre croissant d’infractions commises à l’aide ou contre des systèmes informatiques sont signalées. Les fraudes sur Internet, le harcèlement via les réseaux sociaux et les logiciels de messagerie, le cyber-terrorisme ou encore les intrusions dans des systèmes sont autant d’infractions perpétrées contre des individus ou des entreprises. Ces nouveaux phénomènes obligent les états et les sociétés à investir des sommes d’argent toujours plus importantes pour garantir la sécurité des individus et des installations. Ainsi, le domaine de la criminalistique informatique a connu un essor important ces dernières années.
Les investigations concernant des affaires cybercriminelles sont différentes des investigations plus courantes. Avec l’avancée et l’omniprésence des technologies dans notre environnement, il est demandé aux investigateurs de traiter des grands volumes de données et provenant de sources hétérogènes rendant les tâches de traitement et d’analyse particulièrement difficiles et fastidieuses. De plus, une investigation cybercriminelle est un processus complexe dans lequel chaque conclusion doit être supportée par des pièces à conviction collectées de manière rigoureuse afin de leur donner le poids et la crédibilité nécessaire pour faire avancer l’enquête. Dans ce projet, nous nous intéressons plus particulièrement à la phase de reconstruction de scénarios d’une investigation. Cette étape permet aux enquêteurs et à la Justice d’avoir un aperçu global des évènements survenus durant l’incident faisait l’objet de l’enquête. La reconstruction de scénarios peut être vu comme un processus prenant en entrée un ensemble de pièces à conviction et produisant en sortie la chronologie des évènements concernant l’incident.
L’approche proposée par notre équipe se situe au croisement des domaines de la criminalistique informatique et du web sémantique. Dans nos travaux, une nouvelle méthodologie, étayée par une théorie, est proposée pour assister les enquêteurs à travers le processus de reconstruction (construction de la chronologie et analyse). Pour cela, une ontologie intégrant les connaissances liées au savoir-faire métier d’experts de la criminalistique informatique et de développeurs de logiciels est utilisée. L’utilisation d’une ontologie nous permet de représenter les évènements de manière détaillée et par la suite de les analyser de manière automatique et pertinente.

Participants

Ce projet a été initié et est encadré par le professeur Christophe Nicolle, membre de l'équipe CheckSem du laboratoire Le2i UMR CNRS 6306 et associé à l'université de Bourgogne, et le professeur Tahar Kechadi, membre de la School of Computer Science and Informatics de l'University College Dublin. Aurélie Bertaux, maître de conférences à l'université de Bourgogne, a rejoint le projet par la suite en qualité d'encadrant.

Projets passés


OntoMining: Data Mining et Web Sémantique pour la construction automatique d’ontologies

Thématiques de recherche

Web Sémantique, Data Mining

Recherche et objectifs

L’ontologie est une conceptualisation partagée d’un domaine (Gruber, 1993) permettant de décrire des connaissances utilisables par les humains et par les machines. L’omniprésence des ontologies dans le partage d’informations et la gestion des connaissances appelle la découverte de techniques efficaces et efficientes pour leur développement. En effet, la construction des ontologies reste à l’heure actuelle une tâche fastidieuse et très consommatrice de temps (car manuelle dans la plupart des cas). De plus, cette tâche nécessite l’intervention d’experts du domaine et d’ontologues, seuls acteurs à posséder les connaissances nécessaires pour réaliser le processus de construction de manière satisfaisante. Or, pour révéler le potentiel du Web Sémantique, il est nécessaire que les ontologies soient largement répandues. Enfin, les ontologies étant une représentation des connaissances d’un domaine, il est également nécessaire d’effectuer des évolutions régulières sur ces dernières afin qu’elles restent en adéquation avec le domaine. Ces nombreuses phases de maintenance viennent s’ajouter à un processus déjà très lourd.
Le but de l’Ontology Learning est de découvrir automatiquement ou semi-automatiquement les différents éléments composant les ontologies que sont les concepts, les relations entre concepts et les relations taxonomiques entre concepts et entre relations et les axiomes (Cimiano, 2006). Les processus d’Ontology Learning peuvent travailler à partir de données de natures variés telles que des textes, des pages Web ou des thésaurus. Ce domaine de recherche donne donc des réponses pour les problèmes d’acquisitions des connaissances pour la construction des ontologies. Les approches de l’Ontology Learning peuvent également être complétées par l’utilisation des techniques issues du domaine du Data Mining dont le but est l’extraction de connaissances à partir de quantités de données importantes. Extraire des connaissances peut signifier mettre en évidence des données cachées, découvrir des corrélations significatives entre des connaissances ou encore prédire de nouvelles connaissances à partir de données existantes. Le domaine du Web Mining, ayant pour objectif d’utiliser les techniques de Data Mining sur le Web, a particulièrement retenu notre attention. En effet, l’utilisation du Web comme ressource présente de nombreux avantages parmi lesquels la redondance élevée des informations permettant de juger de la pertinence et de l’importance de ces dernières, le large panel de domaines traités et la facilité d’accès.
Dans le cadre de ce projet, nous souhaitons nous intéresser plus particulièrement à l’extraction de relations entre concepts. Ces dernières sont utilisées pour marquer les liens grammaticaux (portant sur les objets du langage) ou conceptuelles (portant sur les objets décrient par les concepts) entre les concepts qui composent une ontologie. L’étude de la littérature du domaine de l’Ontology Learning montre que de nombreux travaux se concentrent sur l’apprentissage de relations. L’identification de relations couvre trois des neuf étapes du processus de construction des ontologies décrit par (Cimiano, 2006) :

La phase d’extraction d’une relation sémantique se déroule en deux phases que sont l’identification des concepts intervenant dans la relation et l’étiquetage de la relation. Cette dernière phase, qui est aussi la plus difficile, permet de fixer la sémantique de la relation en lui attribuant notamment un nom.
On peut distinguer deux grandes familles de relations : les relations taxonomiques (ou relation de subsomption) et les relations non-taxonomiques (ou relations transversales). La découverte de liens verticaux comme l’hyperonymie et la méronymie est largement traitée dans la littérature. En revanche, peu de travaux se sont penchés sur les relations non-taxonomiques, qui peuvent pourtant se révéler très importantes dans certaines applications (exemple : identification d’une relation « consommateur-achats souhaités »).
L’extraction de relations non-taxonomiques (ou transversales) à partir de ressources comme des textes ou encore le Web fait toutefois l’objet de nombreuses propositions au sein de la communauté. Ces derniers peuvent être classés selon deux approches que sont l’approche statistiques et l’approche basée sur les patrons. Les propositions suivant la première approche se basent sur des techniques comme l’étude de co-occurrences de termes ou les mesures sémantiques afin d’identifier des couples de termes ou de concepts sémantiquement liés. Ce type de méthodes, bien qu’efficace dans la détection de relations et assez performante, est limité dans la phase de capture de la sémantique des relations identifiées. La seconde approche, quant à elle, permet de combler cette lacune mais est reconnue pour sa lourdeur et son manque de flexibilité. En effet, l’identification d’une relation donnée passe nécessairement par la conception d’un jeu de patrons permettant de couvrir toutes les variations de langage (exemple : une relation de méronymie peut être notamment exprimée par les patrons « X est une partie de Y » et « Y est composé de X »). Il est également à noter que l’approche par patrons, contrairement à l’approche statistiques, ne permet pas de capturer des relations implicites, c’est-à-dire des relations non identifiables au niveau d’une phrase isolée.
La lourdeur de la mise en place de l’approche par patrons est principalement due à l’étape de définitions du jeu de patrons permettant de capturer la relation souhaitée. Dans (Blohm, et al., 2007) et (Blohm & Cimiano, 2008), une proposition pour automatiser le processus de définitions des patrons est présentée. Cette méthode peut être vue comme une approche mixte car elle couple l’utilisation des patrons et des méthodes d’apprentissage pouvant plutôt s’apparentées à l’approche statistique.
Les travaux de ce projet se place dans une approche hybride similaire à celle de (Blohm & Cimiano, 2008). Deux axes de recherche sont explorés :

Participants

J'ai mené ce projet en 2012 dans le cadre de mon pré-stage et de mon stage de deuxième année de Master Informatique. J'ai été encadré par le professeur Christophe Nicolle durant cette période.


OntoVersionning: Gestion du cycle de vie des ontologies

Thématiques de recherche

Web Sémantique

Recherche et objectifs

Description du sujet par Perrine Pittet: "Le monde que nous connaissons est soumis à l’inévitable loi du temps, et en subit donc les évolutions. En effet, le temps est un facteur de changement et qui dit changement du monde, dit changement de la connaissance que nous en avons. Logiquement, si les ontologies décrivent ce monde alors celle-ci doivent intégrer ses changements. Aussi les ontologies ne sont pas seulement impactées par les changements issus de leur domaine. Voici une façon d’examiner les causes de ces changements à partir de la définition de Gruber. Les changements peuvent intervenir également au niveau de la conceptualisation de l’ontologie. En effet, le domaine ou la connaissance que l’on en a peuvent impliquer des changements sur les concepts. Par exemple, un téléphone portable des années 90 n’aura pas la notion d’écran tactile, ni appareil photo etc. qui sont des concepts attribués aux mobiles d’aujourd’hui. De même le concept de smartphone n’existait pas alors. Aussi la conceptualisation de l’ontologie peut être impactée par un nouveau point de vue sur le domaine, par exemple une nouvelle perspective d’utilisation. Dans une ville, un pont sera par exemple vu comme un moyen de traverser une rivière par un automobiliste mais sera vu comme un obstacle à franchir par un bateau. Enfin, la spécification de l’ontologie peut être amenée à changer, notamment lorsque le langage utilisé n’est pas assez expressif. Par exemple si l’on souhaite représenter une disjonction de concepts il n’est possible de le faire qu’avec un langage qui prévoit cette notion. Cela permet notamment de faire en sorte qu’un individu ne puisse pas être à la fois une femme et à la fois un homme dans l’ontologie.
Le domaine de recherche lié à ces problématiques est appelé évolution d’ontologie. L’évolution d’ontologie est un problème d’autant plus crucial que les ontologies sont utilisées par des applications qui en dépendent ou encore par d’autres ontologies. Ainsi un changement opéré sur une ontologie va impacter tous les composants qui en dépendent rendant parfois les concepts inaccessibles. Aussi il existe une notion de cohérence dans les ontologies dont la spécification est basée sur la logique. En effet un changement peut entrainer des contradictions à l’intérieur de l’ontologie. Alors l’ontologie incohérente ne peut plus être utilisée pour inférer de nouvelles connaissances ou encore garantir un fonctionnement cohérent de l’application qui l’utilise. La gestion de la cohérence de l’ontologie pendant son évolution est un des points les plus critiques. Enfin l’évolution d’une ontologie génère de nouvelles versions de celles-ci et pour garantir l’accès à une version donnée, l’ontologie doit se munir d’un système de versioning. Le domaine de recherche lié à cette problématique s’intitule le versioning d’ontologie. Combiné à l’évolution, le versioning permet un accès en toute transparence aux différentes versions de l’ontologie. Aussi il permet de conserver l’historique de tous les changements effectués sur chaque version, ce qui peut permettre des traitements comparatifs ou autres vérifications ultérieures à l’évolution."

Participants

Ce projet est mené par Perrine Pittet dans le cadre de sa thèse encadrée par Christophe Nicolle et Christophe Cruz. J'ai participé à ce projet lors d'un stage réalisé durant ma première année de Master Informatique. J'ai notamment participé au développement d'un premier prototype afin de valider les travaux de recherche de Perrine Pittet.