Indexed Bit Map (IBM) for Mining Frequent Sequences - Université de Lille
Communication Dans Un Congrès Année : 2005

Indexed Bit Map (IBM) for Mining Frequent Sequences

Résumé

Sequential pattern mining has been an emerging problem in data mining. In this paper, we propose a new algorithm for mining frequent sequences. It processes only one scan of the database thanks to an indexed structure associated to a bit map representation. Thus, it allows a fast data access and a compact storage in main memory. The experimental results show the efficiency of our method compared to existing algorithms. It has been tested on synthetic data and on real data containing sequences of activities of a urban population time-use survey.
La recherche de séquences fréquentes est un des problèmes récemment étudié en fouille de données. Dans cet article, nous proposons une nouvelle méthodologie pour la découverte de séquences fréquentes. L'algorithme proposé recherche des motifs fréquents en respectant l'ordre des articles. Ses performances ont été optimisées grâce aux structures et aux index proposés. En effet, il n'effectue qu'une seule lecture dans la base de données tout en ayant une représentation des données peu gourmande en mémoire et performante lors de la recherche de sous-séquences fréquentes. Les résultats expérimentaux démontrent l'efficacité de notre algorithme par rapport aux algorithmes existants. Il a été testé dans le contexte d'analyse de séquences d'activités de la population dans le cadre d'une enquête sur la mobilité urbaine. Les résultats expérimentaux démontrent l'efficacité de notre méthode comparée aux algorithmes existant.
Fichier principal
Vignette du fichier
eS9KXQ-document.pdf (211 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04371643 , version 1 (03-01-2024)

Licence

Identifiants

Citer

Lionel Savary, Karine Zeitouni. Indexed Bit Map (IBM) for Mining Frequent Sequences. PKDD 2005: 9th European Conference on Principles and Practice of Knowledge Discovery in Databases, Oct 2005, Porto, Portugal. pp.659-666, ⟨10.1007/11564126_70⟩. ⟨hal-04371643⟩
14 Consultations
5 Téléchargements

Altmetric

Partager

More