TP1 Business Process Analytics

Université Paris Dauphine - M2 STIN, 2020

Objectifs du TP

  • Comprendre les enjeux de découverte de modèles
  • Découvrir ProM et ses packages
  • Découvrir la librairie Pm4Py
  • Manipuler un log

TP à rendre par mail à la fin de la séance (boltenhagen [at] lsv [dot] fr).

1. Charger les données

Téléchargez le fichier de log suivant : [CSV].
Importez les données et répondez aux questions suivantes :

  1. Listez les activités.
  2. Combien il y-a-t-il de séquences ?
  3. Combien il y-a-t-il de variantes de séquences ? Justifiez.
Afin de faciliter la lecture du log, vous pouvez utiliser le module Convert CSV to XES (documentation).

  1. Listez les informations d'un évènement.

2. Découverte de modèles avec ProM

Afin de comprendre les comportements qui existent dans un log, nous avons la possibilité de les représenter à l'aide de modèles de processus. En cours, nous avons vu en détail les modèles BPMN et les réseaux de Petri.

  1. Dessiner un réseau de Petri qui vous semble représenter au mieux les comportements du log. Vous pouvez utiliser draw.io.

De nombreux algorithmes de découverte de processus existent. Lancer les différents algorithmes suivants :
  • Inductive Miner
  • Alpha Miner
  • Alpha# Miner
  • ILP Miner
Les algorithmes nécessiteront peut-être d'un évènement de début et de fin de processus pour chaque séquence. Pour cela, utiliser le module : Add Artificial Events.

Répondez aux questions suivantes :
  1. Quel modèle se rapproche le plus de votre modèle ? Expliquer.
  2. Comment peut-on expliquer les différences entre les modèles découverts ?
  3. Y-a-t-il un/des modèle/s qui vous semble/nt faux ? Expliquez.

Lancez maintenant le module Mine with Inductive Visual Miner. Si vous optenez une erreur au lancement du module, ajouter un évènement de début et de fin à chaque séquence (un module existe). Ce module vous donne un modèle BPMN beaucoup plus lisible et compréhensible que les réseaux de Petri.
Comparer le modèle optenu avec ce module et le Petri net optenu avec le module Mine Petri net with Inductive Miner.

  1. Déduisez-en le sens des transitions noires dans le réseau de Petri.
  2. Pouvez-vous expliquer l'intérêt de diminuer le nombre de chemins et d'activités représentés sur le modèle BPMN ?
Téléchargez le log suivant représentant des données hospitalières provenant des Pays-Bas : [XES.GZ] et lancer le module Mine with Inductive Visual Miner (durée de chargement légèrement plus grande). Vous pouvez ainsi réduire le nombre d'activités et voir le comportement du modèle.

3. Manipulation rapide avec Pm4Py

Pm4py est une très récente (2018) librairie Python qui implémente les algorithmes de Process Mining.

  1. Quel est l'intérêt d'avoir une librairie (ou une API) plutôt qu'un logiciel contenant les algorithmes ?
  2. Faites un script ptyhon donnant une visualisation du résultat l'alpha miner et de l'inductive miner.

Dans le temps restant, parcourez les modules de ProM, les outils de Process Mining et/ou les articles scientifiques de Process Mining afin de définir votre sujet de présentation.

Top