Kurzbeschreibung
Die Serverinfrastruktur umfasst ein Netzwerk von 18 leistungsstarken Serversystemen der Firma Supermicro mit Multi-Core-Prozessoren auf Basis der x86-64-Architektur für Berechnungen und Versuchsaufbauten im Bereich der Datenbank- und Algorithmenforschung. Die Knoten sind mit 40Gbit/s Ethernet, 2x 56Gbit/s (10 Knoten) und 3x 200Gbit/s Infiniband (3 Knoten) verbunden und können speziell für die hardwarenahe Programmierung und Entwicklung mit RDMA verwendet werden.
Es stehen Systeme mit 96GB bis 2TB RAM und 12 bis 64 CPU-Kernen zur Verfügung. Für die Speicherung von Forschungsdaten stehen schnelle Speichersysteme in RAID-Verbünden mit mehrfacher Redundanz und Backups an verschiedenen Standorten zur Verfügung. Ein CI-System unterstützt die schnelle Entwicklung von Forschungssoftware.
Das System ist so konzipiert, dass es unterschiedliche Anforderungsprofile erfüllt. Speicher- und rechenintensive Anwendungen sowie verteilte Berechnungen können auf mehreren Knoten durchgeführt werden. Darüber hinaus können Anwendungen und Betriebssysteme isoliert betrieben und mithilfe von Virtualisierung und Containern abstrahiert werden.
Für den Zugriff auf die Serverinfrastruktur stehen Forschungsrechner auf Basis der x86-64-Architektur zur Verfügung, die mit verschiedenen Betriebssystemen (Windows, Linux, MacOS) ausgestattet sind.
Ansprechperson
Prof. DI Dr. Nikolaus Augsten
Research Services
Systeme und Algorithmen zur Datenverarbeitung
Speichern und Abfragen großer Datenmengen
Ungefähre Abfrageverarbeitung
Raum-zeitliche Datenbanksysteme
GIS-fähige Datenbanken
Verbundene Knoten mit 2x56Gbit/s Infiniband (pro Rechenknoten) bzw. 2x200Gbit/s und 40Gbit/s Ethernet-Technologie
Direkter Infiniband-Hardwarezugriff für RDMA-fähige Software und Dienste
Abstraktion und Isolierung laufender Systeme durch Virtualisierung und Container-Technologien
Datenbank-as-a-Service (DH-Infra-Projekt)
Test- und Entwicklungsinfrastruktur-Service (DH-Infra-Projekt)
Methoden & Expertise zur Forschungsinfrastruktur
Die Forschungsinfrastruktur gliedert sich in zwei Teile: Eine Forschungsinfrastruktur und eine Serviceinfrastruktur.
Die Forschungsinfrastruktur ist für die Forschung im Bereich Data Engineering mit dem Ziel konzipiert, Effizienzprobleme in der Datenverarbeitung zu lösen. In diesem Forschungszweig werden neue Algorithmen entwickelt, implementiert und empirisch evaluiert. Die empirische Auswertung erfordert präzise Laufzeitmessungen, Messungen des Speicherverbrauchs sowie des Netzwerkverkehrs. Dies erfordert in der Regel einen exklusiven und physischen Zugriff (Bare-Metal) auf einzelne Server oder einen Cluster von Servern. Der Einsatz ist geprägt von häufig wechselnden Konfigurationen, um Tests unter unterschiedlichen Bedingungen durchführen zu können.
Die Service-Infrastruktur konzentriert sich auf die Bereitstellung virtualisierter Umgebungen für Datenbanken und Infrastruktur als Service für die Digital Humanities in Salzburg und Österreich. Das Design der Service-Infrastruktur stellt sicher, dass wir die Hardware- und Software-Einstellungen an die Bedürfnisse von Service-Projekten anpassen können und gleichzeitig ein hohes Maß an Sicherheit bieten.
Die Forschungsinfrastruktur wird technisch professionell administriert und bietet unterstützende Dienstleistungen für die Durchführung von Experimenten, z.B. versionierte Speicherung von Versuchsaufbauten und großen experimentellen Daten, E2EE für sensible Forschungsdaten, vollautomatische Bereitstellung von Clusterknoten sowie Datenbanken für Messergebnisse. Die Forscher werden beim Aufbau ihrer Experimente vom technischen Personal unterstützt und beraten. Aus wissenschaftlicher Sicht gibt es einen reichen Erfahrungsschatz im Entwurf und der empirischen Bewertung von Single-Core-, Multi-Core-, parallelen Shared-Nothing- und verteilten Algorithmen.
Johannes Gutenberg University Mainz (JGU)
Technical University Munich
Celonis SE, Munich
Findologic GmbH, Salzburg
Salzburg Research GmbH
DESQ - Declarative and Efficient Similarity Queries
2022 - 2026
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://dbresearch.uni-salzburg.at/projects/desq/index.php
BOSS 1.0: Biblical Online Synopsis Salzburg 1.0
2021 - 2024
Univ. Prof. Nikolaus Augsten, Assoz.-Prof. Martin Schäler, Univ. Prof. Kristin De Troyer
Land Salzburg
https://dbresearch.uni-salzburg.at/projects/
Fast and Flexible Tree Edit Distance (FFTED) Projekt
2017-2021
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://ffted.dbresearch.uni-salzburg.at/
FWF Doctoral College GIScience
2015-2019
Nikolaus Augsten, Euro Beinat, Stefan Lang, Franz Neubauer, Anette Bartsch, Thomas Blaschke, Michael Leitner, Josef Strobl
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://dk-giscience.zgis.net/
Synonyme für Suchmaschinen
2018-2019
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Findologic GmbH, Österreichische Forschungsförderungsgesellschaft mbH
Proc. ACM Manag. Data (2024)
Daniel Ulrich Schmitt, Daniel Kocher, Nikolaus Augsten, Willi Mann, Alexander Miller: A Two-Level Signature Scheme for Stable Set Similarity Joins. Proc. VLDB Endow. 16(11): 2686-2698 (2023)
https://doi.org/10.14778/3611479.3611480
Oksana Dolmatova (Univ. Zurich), Nikolaus Augsten (Univ. Salzburg), Michael H. Böhlen (Univ. Zurich):
A Relational Matrix Algebra and its Implementation in a Column Store. SIGMOD Conference 2020: 2573-2587
https://doi.org/10.1145/3318464.3389747
Thomas Hütter (Univ. Salzburg), Maximilian H. Ganser (Univ. Salzburg), Manuel Kocher (Univ. Salzburg), Merima Halkic (Univ. Salzburg), Sabine Agatha (Univ. Salzburg), Nikolaus Augsten (Univ. Salzburg):
DeSignate: detecting signature characters in gene sequence alignments for taxon diagnoses. BMC Bioinform. 21(1): 151 (2020)
https://doi.org/10.1186/s12859-020-3498-6
Set Similarity Joins on MapReduce: An Experimental Survey
2018
Fabian Fier (Humboldt-Universität zu Berlin), Nikolaus Augsten (Univ. Salzburg), Panagiotis Bouros (Johannes Gutenberg University Mainz), Ulf Leser (Humboldt-Universität zu Berlin), Johann-Christoph Freytag (Humboldt-Universität zu Berlin) PVLDB 11(10): 1110-1122
https://doi.org/10.14778/3231751.3231760
An Empirical Evaluation of Set Similarity Join Techniques
2016
Willi Mann (Univ. Salzburg), Nikolaus Augsten (Univ. Salzburg), Panagiotis Bouros (Aarhus Univ., Denmark) PVLDB 9(9): 636-647
https://doi.org/10.14778/2947618.2947620
On-the-fly token similarity joins in relational databases
2014
Nikolaus Augsten (Univ. Salzburg), Armando Miraglia (VU Amsterdam), Thomas Neumann (TU München), Alfons Kemper (TU München) SIGMOD Conference 2014: 1495-1506
https://doi.org/10.1145/2588555.2610530
JEDI: These aren't the JSON documents you're looking for?
2022
Thomas Hütter, Nikolaus Augsten, Christoph M. Kirsch, Michael J. Carey, Chen Li
SIGMOD Conference 2022: 1584-1597
https://doi.org/10.1145/3514221.3517850
Scaling Density-Based Clustering to Large Collections of Sets
2021
Daniel Kocher, Nikolaus Augsten, Willi Mann
EDBT Conference 2021: 109-120
https://doi.org/10.5441/002/edbt.2021.11
Swellfish privacy: Supporting time-dependent relevance for continuous differential privacy
2022
Christine Tex, Martin Schäler, Klemens Böhm
Information Systems Journal 109
https://doi.org/10.1016/j.is.2022.102079
Set Similarity Joins on MapReduce: An Experimental Survey.
2018
Fabian Fier, Nikolaus Augsten, Panagiotis Bouros, Ulf Leser, Johann-Christoph Freytag
PVLDB 11(10): 1110-1122
https://doi.org/10.14778/3231751.3231760
Tree edit distance: Robust and memory-efficient.
2016
Mateusz Pawlik, Nikolaus Augsten
Inf. Syst. 56: 157-173
https://doi.org/10.1016/j.is.2015.08.004
An Empirical Evaluation of Set Similarity Join Techniques.
2016
Willi Mann, Nikolaus Augsten, Panagiotis Bouros
PVLDB 9(9): 636-647
https://doi.org/10.14778/2947618.2947620
On-the-fly token similarity joins in relational databases.
2014
Nikolaus Augsten, Armando Miraglia, Thomas Neumann, Alfons Kemper
SIGMOD Conference 2014: 1495-1506
https://doi.org/10.1145/2588555.2610530