Wang J, Zeng Y (2011) Dswfp: Effizientes Mining von gewichteten häufigen Mustern über Datenströme. In: Fuzzy systems and knowledge discovery (FSKD), 2011 eighth international conference on, IEEE, vol 2, pp 942–946 Zou Z, Li J, Gao H, Zhang S (2010b) Mining frequent subgraph patterns from uncertain graph data. IEEE Trans Knowl Data Eng 22(9):1203–1218 Die Diagrammdatenbanken können viele signifikante Muster enthalten, die für mehrere Domänen gelten. Das Abbauen seltener Strukturmuster aus diesen Datenbanken ist sowohl eine wesentliche als auch eine komplizierte Aufgabe, die mit zahlreichen Herausforderungen einhergeht. Erstens sind Graphen sehr komplizierte Strukturen und das Abbauen seltener Muster aus ihnen selbst ist ein herausforderndes Problem. Zweitens ist die wichtigste Hürde beim Mining von Graphendatenbanken ihre enorme Größe. Die Graph-Datenbanken sind so groß und kompliziert, dass sie meist nicht in den Hauptspeicher passen. Dies erfordert skalierbare Graphminingtechniken, die sekundären Speicher während des Miningprozesses verwenden können. Der von Tsang et al.
[146] entwickelte RP-Tree-Algorithmus findet die seltenen Itemsets mit einem einzigen Mindestunterstützungsschwellenwert. Es ist eine Erweiterung des FP-Growth-Algorithmus, der die seltenen Artikelsätze minen. Der Algorithmus berücksichtigt nur die Transaktionen, die mindestens ein seltenes Element besitzen. Der Algorithmus ist hocheffizient als andere seltene Muster-Mining-Algorithmen in Bezug auf die Ausführungszeit, aber es gelingt nicht, den vollständigen Satz von seltenen Elementen zu generieren. RP-Tree wird mit mehreren Support-Schwellenwerten von Bhatt und Patel [19] mit dem MCRP-Algorithmus (Maximum Constraint Based Rare Pattern Tree) weiter erweitert. Der Algorithmus erwies sich als hocheffizient, da kostspielige Schnittschritte nicht durchgeführt wurden, aber wieder nicht der komplette Satz seltener Gegenstände produziert. Gupta et al. [44] minen die minimal seltenen Itemsets mit einer anderen Erweiterung des FP-Wachstums namens Inverse FP-Tree (IFP-Tree) Algorithmus. Um die minimalen seltenen Elementsets zu generieren, werden projizierte und verbleibende Bäume verwendet. Die Reststruktur wird verwendet, um die gesamte Datenbank mit Ausnahme der entfernten Elemente zu speichern, während die projizierte Struktur verwendet wird, um nur die häufigen Elemente beizubehalten.
Die Verwendung von Restbäumen reduziert die Rechenkomplexität stark. Der Algorithmus zeigt jedoch keine nennenswerte Leistung bei kleineren dichten Datasets. Giannella C, Han J, Pei J, Yan X, Yu PS (2003) Mining häufige Muster in Datenströmen bei mehrmaligen Granularitäten. Next Gen Data Min 212:191–212 Die allgemeinen Musterminingalgorithmen hängen in hohem Maße von der Zeilenlänge von Tabellen ab. Mit der Erhöhung der Zeilenlänge oder der Anzahl der Spalten wird die Kombination von Elementen exponentiell, was große Schwierigkeiten vor den Musterminingtechniken darstellt. Durch die Beibehaltung seltener Itemsets verschlimmert sich diese Situation besonders bei seltenen Muster-Mining-Techniken. Daher werden effiziente Techniken für seltene Mustermining benötigt, die mit zunehmender Datenbankgröße oder -dimension gut skaliert werden können. Seno M, Karypis G (2002) Slpminer: ein Algorithmus zur Suche nach häufigen sequenziellen Mustern mit längenverringernder Unterstützungseinschränkung. In: Data Mining, 2002.
ICDM 2003. Verfahren. 2002 IEEE International conference on, IEEE, S. 418–425 Adnan M, Alhajj R (2009) Drfp-tree: disk-resident frequent pattern tree. Appl Intell 30(2):84–97 Die extrahierten Muster kodieren die Merkmale der ursprünglichen zeitlichen Sequenz und können für die Datenzusammenfassung und Mustererkennung verwendet werden.
Recent Comments