Data Mining sucht nach versteckten, gültigen und allen möglichen nützlichen Mustern in großen Datenmengen. Data Mining ist eine Technik, mit der Sie unerwartete / unentdeckte Beziehungen zwischen den Daten erkennen können, um geschäftliche Gewinne zu erzielen.
Für das Data Mining stehen viele nützliche Tools zur Verfügung. Im Folgenden finden Sie eine kuratierte Liste der Top 25 handverlesenen Data Mining-Software mit beliebten Funktionen und den neuesten Download-Links. Diese Vergleichsliste enthält sowohl Open Source- als auch kommerzielle Tools.
1) SAS Data Mining:
Das statistische Analysesystem ist ein Produkt von SAS. Es wurde für die Analyse und das Datenmanagement entwickelt. Es bietet eine grafische Benutzeroberfläche für nicht technische Benutzer.
Eigenschaften:
- Mit SAS Data Mining-Tools können Sie Big Data analysieren
- Es ist ein ideales Tool für Data Mining, Text Mining und Optimierung.
- SAS bietet eine verteilte Speicherverarbeitungsarchitektur, die hoch skalierbar ist
Download-Link: https://www.sas.com/en_us/insights/analytics/data-mining.html
2) Teradata:
Teradata ist ein massiv paralleles offenes Verarbeitungssystem zur Entwicklung umfangreicher Data Warehousing-Anwendungen. Teradata kann auf einer Unix / Linux / Windows-Serverplattform ausgeführt werden.
Eigenschaften:
- Teradata Optimizer kann bis zu 64 Joins in einer Abfrage verarbeiten.
- Tera-Daten haben niedrige Gesamtbetriebskosten. Es ist einfach einzurichten, zu warten und zu verwalten.
- Es unterstützt SQL für die Interaktion mit den in Tabellen gespeicherten Daten. Es bietet seine Erweiterung.
- Es hilft Ihnen, die Daten ohne manuellen Eingriff automatisch auf die Festplatten zu verteilen.
- Teradata bietet Dienstprogramme zum Laden und Entladen zum Verschieben von Daten in / aus dem Teradata-System.
Download-Link: https://www.teradata.in/Products/Cloud/IntelliCloud
3) R-Programmierung
R ist eine Sprache für statistische Berechnungen und Grafiken. Es wird auch für die Big-Data-Analyse verwendet. Es bietet eine Vielzahl statistischer Tests.
Eigenschaften:
- Effektive Datenverarbeitungs- und Speichereinrichtung,
- Es bietet eine Reihe von Operatoren für Berechnungen auf Arrays, insbesondere Matrizen,
- Es bietet eine kohärente, integrierte Sammlung von Big-Data-Tools für die Datenanalyse
- Es bietet grafische Funktionen für die Datenanalyse, die entweder auf dem Bildschirm oder auf Papier angezeigt werden.
Download-Link; https://www.r-project.org/
4) VORSTAND
Board ist ein Management Intelligence Toolkit. Es kombiniert Funktionen von Business Intelligence und Corporate Performance Management. Es wurde entwickelt, um Business Intelligence und Business Analytics in einem einzigen Paket bereitzustellen.
Eigenschaften:
- Ermöglicht das Analysieren, Simulieren, Planen und Vorhersagen auf einer einzigen Plattform
- Erstellen von benutzerdefinierten Analyse- und Planungsanwendungen.
- Board All-In-One kombiniert BI, Corporate Performance Management und Business Analytics.
- Es ermöglicht Unternehmen, anspruchsvolle Analyse- und Planungsanwendungen zu entwickeln und zu warten.
- Die proprietäre Plattform hilft bei der Berichterstellung, indem auf mehrere Datenquellen zugegriffen wird.
Download-Link: https://www.board.com/de
5) Dundas
Dundas ist ein unternehmensfähiges Data Mining-Tool, mit dem interaktive Dashboards, Berichte usw. erstellt und angezeigt werden können. Sie können Dundas BI als zentrales Datenportal für das Unternehmen bereitstellen.
Eigenschaften:
- Serveranwendung mit voller Produktfunktionalität
- Integrieren Sie alle Arten von Datenquellen und greifen Sie darauf zu
- Anpassbare Datenvisualisierungen
- Intelligente Drag & Drop-Tools
- Visualisieren Sie Daten über Karten
- Vorausschauende und erweiterte Datenanalyse
Download-Link: http://www.dundas.com/support/dundas-bi-free-trial
6) Inetsoft
Inetsofts Data Mining-Tool-Stil Intelligence ist eine nützliche Data Mining- und Intelligence-Plattform. Es ermöglicht die schnelle und flexible Transformation von Daten aus verschiedenen Quellen.
Eigenschaften:
- Es hilft Ihnen beim Zugriff auf strukturierte und halbstrukturierte Quellen sowie auf lokale Anwendungen
- Ermöglicht die Optimierung von Apps für den Datenverbrauch und die Aktualisierung
- Bieten Sie maßgeschneiderte und sichere Ebenen für die Datenexploration und Berichterstellung.
- Skalieren Sie mithilfe der Inbuilt Spark-Plattform für große Benutzermengen
- Generieren Sie paginierte Berichte mit eingebetteter Geschäftslogik und Parametrisierung
Download-Link: https://www.inetsoft.com/products/StyleIntelligence/
7) H3O
H3O ist ein weiteres hervorragendes Open-Source-Software-Data-Mining-Tool. Es wird verwendet, um eine Datenanalyse für die Daten durchzuführen, die in Cloud-Computing-Anwendungssystemen gespeichert sind.
Eigenschaften:
- Mit H3O können Sie die Rechenleistung verteilter Systeme und In-Memory-Computing nutzen
- Es ermöglicht eine schnelle und einfache Bereitstellung in der Produktion mit Java und Binärformat.
- Es hilft Ihnen, die Programmiersprachen wie R, zu verwenden.
- Python und andere, um ein Modell in H3O zu erstellen
- Verteilte In-Memory-Verarbeitung
Download-Link: https://www.h3o.ai/
8) Qlik
Qlik ist ein Data Mining- und Visualisierungstool. Es bietet auch Dashboards und unterstützt mehrere Datenquellen und Dateitypen.
Eigenschaften:
- Drag-and-Drop-Schnittstellen zur Erstellung flexibler, interaktiver Datenvisualisierungen
- Reagieren Sie sofort auf Interaktionen und Änderungen.
- Unterstützt mehrere Datenquellen und Dateitypen
- Es ermöglicht eine einfache Sicherheit für Daten und Inhalte auf allen Geräten.
- Über einen zentralen Hub können Sie relevante Analysen, einschließlich Apps und Storys, austauschen.
Download-Link: https://www.qlik.com/us/products/qlik-sense
9) RapidMiner:
RapidMiner ist ein kostenloses Data Mining-Tool. Es wird für die Datenvorbereitung, das maschinelle Lernen und die Modellbereitstellung verwendet. Es bietet eine Reihe von Produkten zum Erstellen neuer Data Mining-Prozesse und zur vorausschauenden Setup-Analyse.
Eigenschaften:
- Ermöglichen Sie mehrere Datenverwaltungsmethoden
- GUI oder Stapelverarbeitung
- Integriert in interne Datenbanken
- Interaktive, gemeinsam nutzbare Dashboards
- Big Data Predictive Analytics
- Fernanalyseverarbeitung
- Daten filtern, verbinden, zusammenführen und aggregieren
- Erstellen, trainieren und validieren Sie Vorhersagemodelle
- Berichte und ausgelöste Benachrichtigungen
Download-Link: https://my.rapidminer.com/nexus/account/index.html#downloads
10) Oracle BI
Oracle BI ist ein Open Source-Programm für maschinelles Lernen und Datenvisualisierung für Anfänger und Experten. Interaktive Datenanalyse-Workflows mit einer großen Toolbox.
Eigenschaften:
- Interaktive Datenvisualisierung.
- Es bietet interaktive Datenexploration für eine schnelle qualitative Analyse mit sauberen Visualisierungen.
- Orange unterstützt praktische Schulungen und visuelle Illustrationen von Konzepten aus der Datenwissenschaft.
- Es bietet eine breite Palette von Add-Ons für das Data Mining aus externen Datenquellen.
Download-Link: https://orange.biolab.si/
11) KNIME
KNIME ist Open Source-Software zum Erstellen von Data Science-Anwendungen und -Diensten. Mit diesem Data Mining-Tool können Sie Daten verstehen und Data Science-Workflows entwerfen.
Eigenschaften:
- Hilft Ihnen beim Erstellen von End-to-End-Workflows für Data Science
- Mischen Sie Daten aus einer beliebigen Quelle
- Ermöglicht das Aggregieren, Sortieren, Filtern und Verknüpfen von Daten entweder auf Ihrem lokalen Computer, in der Datenbank oder in verteilten Big-Data-Umgebungen.
- Erstellen Sie Modelle für maschinelles Lernen zur Klassifizierung, Regression und Dimensionsreduzierung
Download-Link: https://www.knime.com/software-overview
12) Tanagra
Tangra ist ein kostenloses Data Mining-Tool für Studien- und Forschungszwecke. Es bietet verschiedene Data Mining-Methoden aus dem statistischen Lernen, der Datenanalyse und dem maschinellen Lernen.
Eigenschaften:
- Bietet benutzerfreundliche Data Mining-Software für Forscher und Studenten
- Der Benutzer kann seine Data Mining-Methoden hinzufügen.
Download-Link: https://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
13) Löser:
Der XLminer von Solver ist ein benutzerfreundliches Data Mining-Tool auf professioneller Ebene für die Datenvisualisierung, Prognose und das Data Mining in Excel. Es bietet umfassende Funktionen zur Datenvorbereitung zum Importieren und Bereinigen Ihrer Daten.
Eigenschaften:
- XLMiner bietet eine umfassende Reihe von Analysefunktionen, die sowohl auf statistischen als auch auf maschinellen Lernmethoden basieren.
- Mit dem Tool können Sie mit großen Datenmengen arbeiten, die möglicherweise die Grenzwerte in Excel überschreiten.
- Es bietet integrierte Funktionen zur Datenexploration und -visualisierung.
- Das Durchsuchen von Daten bietet schnelle Einblicke in versteckte Beziehungen in den Daten.
Download-Link: https://www.solver.com/xlminer-data-mining
14) Sisense
Sisense ist ein weiteres effektives Data Mining-Tool. Es analysiert und visualisiert sofort sowohl große als auch unterschiedliche Datensätze. Es ist ein ideales Werkzeug zum Erstellen von Dashboards mit einer Vielzahl von Visualisierungen.
Eigenschaften:
- Ermöglicht das Erstellen interaktiver Dashboards ohne technische Kenntnisse
- Erstellen Sie eine einzige Version der Wahrheit mit nahtlosen Daten
- Vereinen Sie nicht verwandte Daten an einem zentralen Ort
- Ost Drag & Drop-Benutzeroberfläche
- Ermöglicht den Zugriff auf Dashboards auch auf dem mobilen Gerät
- Aufsehenerregende Visualisierung
- Identifiziert kritische Metriken mithilfe von Filtern und Berechnungen
- Verarbeitet große Datenmengen auf einem einzigen Commodity-Server
Download-Link: https://www.sisense.com/
15) Datenschmelze
DataMelt ist ein kostenloses Tool für numerische Berechnungen, Mathematik, Datenanalyse und Datenvisualisierung. Dieses Programm bietet Ihnen die Einfachheit von Skriptsprachen wie Python, Ruby, Groovy mit der Leistung von Hunderten von Java-Paketen.
Eigenschaften:
- DataMelt bietet Statistiken, Analyse großer Datenmengen und wissenschaftliche Visualisierung.
- Sie können es mit verschiedenen Programmiersprachen auf verschiedenen Betriebssystemen verwenden.
- Sie können damit hochwertige Vektorgrafiken (EPS, SVG, PDF usw.) erstellen, die in LaTeX und einem anderen Textverarbeitungsprogramm enthalten sein können.
- Data Melt bietet die Verwendung von Skriptsprachen, die erheblich schneller sind als das in C implementierte Standard-Python.
Download-Link: https://jwork.org/dmelt/
16) ELKI:
ELKI ist ein in Java geschriebenes Open Source Data Mining-Tool. Das Tool ermöglicht die Erforschung von Algorithmen mit Schwerpunkt auf unbeaufsichtigten Methoden bei der Clusteranalyse und Ausreißererkennung.
Eigenschaften:
- ELKI bietet eine umfangreiche Sammlung hochparametrierbarer Algorithmen
- Es ermöglicht eine einfache und faire Bewertung und ein Benchmarking von Algorithmen.
- ELKI bietet Datenindexstrukturen wie den R * -Baum, die den Prozess des Data Mining verbessern
Download-Link : https://elki-project.github.io/
17) SPMF
SPMF ist eine in Java geschriebene Open-Source-Data-Mining-Bibliothek. Es wird unter der GPL-Lizenz vertrieben. Sie können den Quellcode in andere Java-Software integrieren.
Eigenschaften:
- Ermöglicht das Mining von Zuordnungsregeln
- Unterstützt sequentielles Pattern- und Sequential Rule Mining
- Bietet High-Utility-Pattern-Mining,
- Zeitreihenabbau.
- Unterstützung komplexer Clustering- und Klassifizierungsprozesse
Download-Link: http://www.philippe-fournier-viger.com/spmf/
18) Alteryx
Alteryx ist eine Business Intelligence- und Analyselösung für Unternehmen. Es ist ein speziell entwickeltes Tool für Datenanalysten und Führungskräfte.
Eigenschaften:
- Analytics für mittelständische Unternehmen
- Es ermöglicht eine Ad-hoc-Analyse.
- Bietet schnelle analytische Online-Verarbeitung
- Automatische geplante Berichterstellung
- Hochgradig anpassbares Dashboard
Download-Link: https://www.alteryx.com/
19) Enterprise Miner
Enterprise Miner ist eine SAS-Software, die Ihnen modernste Algorithmen bietet, mit denen Sie die wichtigsten Herausforderungen lösen können, und die besten Lösungen für Ihr Unternehmen bietet.
Eigenschaften:
- Hilft Ihnen, die Vorhersagegenauigkeit zu verbessern. Teilen Sie zuverlässige Ergebnisse
- Einfach zu bedienende GUI und Stapelverarbeitung
- Erweiterte prädiktive und deskriptive Modellierung
- Bietet automatisiertes Scoring
- Automatisieren Sie die Modellbereitstellung und -bewertung
Download-Link: https://www.sas.com/en_us/software/enterprise-miner.html
20) Datenuhr
Datawatch Desktop ist eine Data Mining- und Business Intelligence-Lösung. Sie können sich auf die Echtzeit-Datenvisualisierung konzentrieren. Es bietet Tools zum Erstellen und Bereitstellen ihrer Überwachungs- und Analysesysteme, ohne dass eine einzige Codezeile geschrieben werden muss.
Eigenschaften:
- Mit der Drag & Drop-Funktion können Benutzer eine benutzerdefinierte Ansicht von Daten erstellen
- Identifizieren Sie Handelsanomalien
- Analysieren Sie anhand historischer Daten, wie sich alternative Szenarien auf die Leistung auswirken
Download-Link: https://www.datawatch.com/in-action/panopticon-streaming-analytics-platform/
21) Fortgeschrittener Bergmann
Ein Advanced Miner ist ein nützliches Werkzeug für die Datenverarbeitung, Analyse und Modellierung. Über die benutzerfreundliche Workflow-Oberfläche können Sie verschiedene Datentypen untersuchen.
Eigenschaften:
- Extrahieren und Speichern von Daten aus / in verschiedene Datenbanksysteme, Dateien und Datentransformationen
- Bietet verschiedene Vorgänge für Daten an, z. B. Stichproben, Zusammenfügen von Datensätzen usw.
- Hilft Ihnen beim Erstellen statistischer Modelle, der Analyse variabler Wichtigkeit, der Clusteranalyse usw.
- Einfache und effektive Integration von Modellen in externe IT-Anwendungen
Download-Link: https://algolytics.com/products/advancedminer/
22) Analytischer Löser
Analytic Solver kann das Point-and-Click-Tool kostenlos verwenden. Sie können damit Risikoanalysen und präskriptive Analysen in Ihrem Browser durchführen. Es bietet Data Mining-Jobs mit voller Leistung.
Eigenschaften:
- Hilft Ihnen, Unsicherheiten zu berücksichtigen und mit Simulationsoptimierung, stochastischer Programmierung und robuster Optimierung zu lösen.
- Ermöglicht das Definieren des Monte-Carlo-Simulationsmodells mithilfe von Excel-Formeln
Download-Link: https://analyticsolver.com/
23) PolyAnalyst
PolyAnalyst ist das Data Mining- und Analysetool zum Extrahieren von verwertbarem Wissen, das verborgen und tatsächlich strukturiert ist.
Eigenschaften:
- Hilft Ihnen, auf Daten aus verschiedenen Quellen zuzugreifen und Daten aus verschiedenen Quellen zusammenzuführen
- Sie können aus einer breiten Auswahl statistischer und maschineller Lernalgorithmen auswählen.
- Bietet Ihnen die Möglichkeit, einen Füllbericht zu erstellen, der zusammengefasst werden kann und Ihre Erkenntnisse kommuniziert
Download-Link: https://www.megaputer.com/polyanalyst/
24) Civis
Mit Civis können Sie fundierte Entscheidungen unter Berücksichtigung des Datenwissenschaftlers und des Entscheidungsmarkts treffen. Es ermöglicht Ihrem Team, effizient zusammenzuarbeiten und schneller Lösungen zu finden.
Eigenschaften:
- Bietet Architektur, Produkte und Prozesse, mit denen Sie Ihre Daten schützen können
- Sie können mit einer Bibliothek von Datenaufnahme- und ETL-Modulen konfigurieren.
- Schreiben Sie Code in ein Skript, bieten Sie mehrere Skripte oder Jobs in einen Workflow an und definieren Sie einen Workflow, der nach einem Zeitplan ausgeführt werden soll.
- Ermöglicht es Ihnen, Ihre Analysen und Modelle in Anwendungen umzuwandeln, die auf einer flexiblen Infrastruktur auf Produktionsebene ausgeführt werden
Download-Link: https://www.civisanalytics.com/civis-platform/
25) Viscovery:
Viscovery ist eine Workflow-orientierte Software-Suite. Es basiert auf selbstorganisierenden Karten und multivariaten Statistiken für exploratives Data Mining und prädiktive Modellierung. Das System zeichnet sich durch eine intuitive Benutzerführung und eine ausgereifte Implementierung aus.
Eigenschaften:
- Eine ideale Projektumgebungsplattform für zielorientierten Betrieb
- Spezielle Workflows, mit denen Sie eine gezielte Navigation anbieten können
- Löschen Sie Workflow-Schritte mit bewährten Standardeinstellungen
- Workflow-Verzweigung, die die Generierung von Modellvariationen ermöglicht
- Funktionen zur integrierten Dokumentation und Annotation
- Mehrere Handhabungswerkzeuge zur Erleichterung der Verwendung
Download-Link: https://www.viscovery.net/somine/