Database Research Cluster

Universität Salzburg

Salzburg | Website

Core Facilities (CF)

Kurzbeschreibung

Die Serverinfrastruktur umfasst ein Netzwerk von 15 leistungsfähigen Serversystemen der Firma Supermicro mit Mehrkernprozessoren auf Basis der x86-64 Architektur für Berechnungen und Versuchsaufbauten im Bereich der Datenbank- und Algorithmenforschung. Die Knoten sind untereinander mit 10Gbit/s Ethernet und 2x 56Gbit/s Infiniband FDR (pro Node) verbunden und können dezidiert für hardwarenahe Programmierung und Entwicklung mit RDMA verwendet werden.

Zusätzlich können Applikationen und Betriebssysteme mittels Virtualisierung isoliert und abstrahiert und in Containern betrieben werden. Die Ausstattung erlaubt es, verschiedenen Anforderungsprofilen gerecht zu werden. Es können sowohl speicher- und rechenintensive Anwendungen, als auch verteilte Berechnungen auf mehreren Nodes durchgeführt werden. Es stehen Systeme mit 96GB bis zu 1TB Arbeitsspeicher zur Verfügung und mit 12 bis 64 CPU-Kernen. Für die Speicherung der Forschungsdaten sind schnelle Speichersysteme im RAID-Verbund mit mehrfacher Redundanz und Backups an verschiedenen Standorten vorhanden. Zur schnellen Entwicklung von Forschungssoftware steht ein CI-System zur Verfügung.

Für den Zugriff auf die Serverinfrastruktur, sind Forschungsrechner auf Basis der x86-64 Architektur, ausgestattet mit verschiedenen Betriebssystemen (Windows, Linux, MacOS), verfügbar.

Ansprechperson

Prof. DI Dr. Nikolaus Augsten

Research Services

Systeme und Algorithmen für die Datenverarbeitung
Speicherung und Verarbeitung von großen Datensätzen
GIS-Datenbanken
Vernetzte Clusternodes mit 10 Gbit/s Ethernet und 2x 56Gbit/s Infiniband (pro Node)
Direkter Zugriff auf die Infiniband-Hardware für Software und Dienste mit RDMA-Unterstützung
Abstrahierung und Isolation von laufenden Systemen mittels Virtualisierung und Containertechnologien

Methoden & Expertise zur Forschungsinfrastruktur

Die Forschungsinfrastruktur ist für die Forschung im Bereich Data Engineering ausgelegt mit dem Ziel, Effizienzprobleme in der Datenverarbeitung zu lösen. In diesem Forschungszweig werden neue Algorithmen entwickelt, implementiert und empirisch evaluiert. Die empirische Evaluierung erfordert präzise Laufzeitmessungen, Messungen des Speicherverbrauchs, sowie des Netzwerkverkehrs. Dazu ist meist ein exklusiver und physischer Zugang (Bare Metal) zu einzelnen Servern oder einem Cluster von Servern notwendig. Die Nutzung ist charakterisiert durch häufig sich ändernde Konfigurationen um Tests unter verschiedenen Bedingungen ausführen zu können.

Die Forschungsinfrastruktur wird technisch professionell administriert und bietet unterstützende Services für die Ausführung von Experimenten, z.B. versionierte Speicherung von experimentellen Setups und großen experimentellen Daten, E2EE für sensible Forschungsdaten, vollautomatische Provisionierung der Cluster Nodes, sowie Datenbanken für Messergebnisse. Forscher und Forscherinnen werden beim Setup ihrer Experimente vom technischen Personal unterstützt und beraten. In wissenschaftlicher Hinsicht besteht ein ausgeprägter Erfahrungsschatz im Design und der empirischen Evaluierung von single-core, multi-core und parallelen sowie verteilten shared-nothing Algorithmen.

Prof. DI Dr. Nikolaus Augsten
Fachbereich Computerwissenschaften
0043 662 8044 6347
nikolaus.augsten@sbg.ac.at
https://dbresearch.uni-salzburg.at/
Bitte kontaktieren Sie uns unter science.plus@sbg.ac.at, oder kontaktieren Sie direkt die/den FI-Verantwortliche/n
Humboldt-Universität zu Berlin
Johannes Gutenberg Universität Mainz (JGU)
Technische Universität München
Celonis SE, München
Findologic GmbH, Salzburg
Salzburg Research Forschungsgesellschaft m.b.H.
Spring: Scalable Process Mining
2021-2024
Celonis SE, Munich; Univ. Salzburg
Industrieförderung

Fast and Flexible Tree Edit Distance (FFTED) Projekt
2017-2021
Univ. Salzburg
Fonds zur Förderung der wissenschaftlichen Forschung: FWF https://ffted.dbresearch.uni-salzburg.at/

FWF Doctoral College GIScience
2015-2019
Univ. Salzburg
Fonds zur Förderung der wissenschaftlichen Forschung: FWF https://dk-giscience.zgis.net/

Synonyme für Suchmaschinen
2018-2019
Univ. Salzburg, Findologic GmbH
Österreichische Forschungsförderungsgesellschaft mbH

Fast and Flexible Tree Edit Distance (FFTED) Projekt
2017-2021
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://ffted.dbresearch.uni-salzburg.at/

FWF Doctoral College GIScience
2015-2019
Nikolaus Augsten, Euro Beinat, Stefan Lang, Franz Neubauer, Anette Bartsch, Thomas Blaschke, Michael Leitner, Josef Strobl
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://dk-giscience.zgis.net/

Synonyme für Suchmaschinen
2018-2019
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Findologic GmbH, Österreichische Forschungsförderungsgesellschaft mbH
Oksana Dolmatova (Univ. Zurich), Nikolaus Augsten (Univ. Salzburg), Michael H. Böhlen (Univ. Zurich):
A Relational Matrix Algebra and its Implementation in a Column Store. SIGMOD Conference 2020: 2573-2587
https://doi.org/10.1145/3318464.3389747

Thomas Hütter (Univ. Salzburg), Maximilian H. Ganser (Univ. Salzburg), Manuel Kocher (Univ. Salzburg), Merima Halkic (Univ. Salzburg), Sabine Agatha (Univ. Salzburg), Nikolaus Augsten (Univ. Salzburg):
DeSignate: detecting signature characters in gene sequence alignments for taxon diagnoses. BMC Bioinform. 21(1): 151 (2020)
https://doi.org/10.1186/s12859-020-3498-6

Set Similarity Joins on MapReduce: An Experimental Survey
2018
Fabian Fier (Humboldt-Universität zu Berlin), Nikolaus Augsten (Univ. Salzburg), Panagiotis Bouros (Johannes Gutenberg University Mainz), Ulf Leser (Humboldt-Universität zu Berlin), Johann-Christoph Freytag (Humboldt-Universität zu Berlin) PVLDB 11(10): 1110-1122
https://doi.org/10.14778/3231751.3231760

An Empirical Evaluation of Set Similarity Join Techniques
2016
Willi Mann (Univ. Salzburg), Nikolaus Augsten (Univ. Salzburg), Panagiotis Bouros (Aarhus Univ., Denmark) PVLDB 9(9): 636-647
https://doi.org/10.14778/2947618.2947620

On-the-fly token similarity joins in relational databases
2014
Nikolaus Augsten (Univ. Salzburg), Armando Miraglia (VU Amsterdam), Thomas Neumann (TU München), Alfons Kemper (TU München) SIGMOD Conference 2014: 1495-1506
https://doi.org/10.1145/2588555.2610530

Set Similarity Joins on MapReduce: An Experimental Survey
2018
Fabian Fier, Nikolaus Augsten, Panagiotis Bouros, Ulf Leser, Johann-Christoph Freytag
PVLDB 11(10): 1110-1122
https://doi.org/10.14778/3231751.3231760

Tree edit distance: Robust and memory-efficient
2016
Mateusz Pawlik, Nikolaus Augsten
Inf. Syst. 56: 157-173
https://doi.org/10.1016/j.is.2015.08.004

An Empirical Evaluation of Set Similarity Join Techniques
2016
Willi Mann, Nikolaus Augsten, Panagiotis Bouros
PVLDB 9(9): 636-647
https://doi.org/10.14778/2947618.2947620

On-the-fly token similarity joins in relational databases
2014
Nikolaus Augsten, Armando Miraglia, Thomas Neumann, Alfons Kemper
SIGMOD Conference 2014: 1495-1506
https://doi.org/10.1145/2588555.2610530