Sie sind hier: Startseite Forschung

Data Mining

Graph Mining
Im Graph Mining versucht man interessante Pattern in Graphen zu finden. Unsere Arbeitsgruppe hat in diesem Bereich an zwei Projekten gearbeitet: FreeTreeMiner und gSpan'.
Induktive Datenbanken
Um die Analyse von komplexen und strukturierten Daten komplett zu unterstützen, werden neue numerische Methoden und geeignete Schnittstellen für die Daten Exploration entwickelt werden müssen. Darüber hinaus ist es wünschenswert, alle Aufgaben im Knowledge Discovery-Prozess durchzuführen, von Pre-Processing, zum Post-Processing, auf der Grundlage der Abfragesprachen. Induktive Abfragesprachen sollte den Umgang mit Mustern / Modellen als First-Class-Objekte erlauben, das richtige Maß an Abstraktion anieten (d.h. sinnvolle Bausteine ​​der Daten-Analyse), und die Kompositionalität von Data Mining-Aufgaben betonen.
Quantitative Association Rules
Das Erweitern von Pattern und Assoziationsregel um numerische Parameter hat Interesse in Bereich Data Mining geweckt. Die Definition von Pattern und Regel wird ein nicht-triviales Problem, wenn Zahlen im Pattern Mining berücksichtigt werden sollen. Wir präsentieren einen neuen Ansatz für quantitative Assoziationsregeln auf Halbräumen und zeigen, wie es auf das Problem der Analyse von Geneexpressionsdaten angewendet werden kann.
String Mining
In vielen Anwendungen (z.B. in Computational Biology) möchte man in Daten interessante String- oder Sequence-Pattern finden. Anwendungsgebiete sind unter anderem das Finden von discriminative Features for Sequence Classification or Segmentation, das Entdecken neuer Binding Motifs of Transcription Factors oder Probe Design. Wir schlagen einen neuen algorithmischen Framework vor, der in Datenbanken häufigkeitsbezogene Data Mining Anfragen auf Strings in optimaler Zeit auflöst, dass heißt linear in der Ein- und Ausgabe.

Maschinelles Lernen

Adaptiver Transfer von Distanzen für QSARs
Informationen und Datasets für die Discovery Science 2010 Publikation und die Computer Journal 2012 Submission.
Fast Conditional Density Estimation für Quantitative Struktur-Wirkungsbeziehungen
Viele Methoden für quantitative Struktur-Aktivitätsbeziehungen (QSARs) liefern nur Punktschätzungen ohne die inherente Unsicherheit der Vorhersage zu quantifizieren. Eine Möglichkeit statt der Punktschätzung die Unsicherheit einer QSAR Vorhersage anzugeben ist die Vorhersage von bedingten Wahrscheinlichkeitsdichten der Aktivität gegeben die Struktur vorherzusagen. Wenn eine bedingte Dichteschätzung verfügbar ist, ist es einfach Vorhersageintervalle abzuleiten. In dieser Arbeit vergleichen und evaluieren wir drei Methoden für die bedingte Dichte-Schätzung auf ihre Eignung in QSAR-Modellierung.
Lokale Modelle zur Verbesserung von (Q)SAR Vorhersagen
Kürzlich veröffentlichten Benigni und Bossa dass lokale QSAR Modelle Ergebnisse produzieren können, die mechnanistisch interpretierbar sind und gut mit den bekannten Grenzen der Reproduzierbarkeit experimenteller Systeme vergleichbar sind. Viele bestehende große Datenbanken können jedoch nicht direkt genutzt werden um lokale QSAR Modelle zu erstellen, da sie diverse Gruppen von nicht-congenerischen Strukturen enthalten. Wir präsentieren einen neuen QSAR Ansatz der Gruppen von Strukturen entdeckt, die für lokales QSAR verwendet werden können.
Margin-Based Rule Learning
Während sich ältere Arbeiten im Bereich des Maschinellen Lernens auf Modelle beschränken, die vom Menschen leicht verstanden werden können (z.B. Entscheidungsbäume oder Regeln), optimieren neuere Ansätze im statistischen Lernen fast ausschließlich die Performanz der Vorhersage, auf Kosten der Verständlichkeit. In vielen Anwendungsgebieten (z.B. Umwelt- oder Medizinwissenschaften) wird jedoch ein verständliches Modell mit starker theoretischer und statistischer Grundlage benötigt. Daher schlagen wir eine Synthese aus Methoden des klassischen Maschinellen Lernens und des statistischen Lernens vor.

Anwendungen

OpenTox
Das Ziel des Projektes war es, ein Framework zu entwickeln, das einheitlichen Zugriff auf Toxizitätsdaten, (Q)SAR Modellen, Validierungsmethoden und zusätzlichen Informationen zur Interpretation von (Q)SAR Modellen zu entwickeln.
RECESS
Das Forschungsziel von RECESS ist es, neue Erkenntnisse über die Regulierung komplexer zellulärer Systeme durch Zusammenführen verschiedener Forschungsgebiete (wie Bioinformatik, Bioengineering, Biologie und Biochemie) zu gewinnen.
Nachrichten
Poster Wissenschaftsmarkt (17.09.2012)
Neue Webseite (16.02.2012)
Termine
Software Engineering - Nachholklausur 07.06.2013 10:00 - 13:00 — 05-426
Lehrveranstaltungen