Universität Salzburg
Salzburg | Website
Kurzbeschreibung
Die Serverinfrastruktur umfasst ein Netzwerk von 15 leistungsfähigen Serversystemen der Firma Supermicro mit Mehrkernprozessoren auf Basis der x86-64 Architektur für Berechnungen und Versuchsaufbauten im Bereich der Datenbank-und Algorithmenforschung, Die Knoten sind untereinander mit 10Gbit/s Ethernet und 2x 56Gbit/s Infiniband FDR (pro Node) verbunden und können dezidiert für hardwarenahe Programmierung und Entwicklung mit RDMA verwendet werden.
Zusätzlich können Applikationen und Betriebssysteme isoliert und abstrahiert mittels Virtualisierung und in Containern betrieben werden. Die Ausstattung erlaubt es, verschiedenen Anforderungsprofilen gerecht zu werden. Es können sowohl speicher- und rechenintensive Anwendungen als auch verteilte Berechnungen auf mehreren Nodes durchgeführt werden. Es stehen Systeme mit 96GB bis zu 1TB Arbeitsspeicher zur Verfügung und mit 12 bis 64 CPU-Kernen. Für die Speicherung der Forschungsdaten stehen schnelle Speichersysteme im RAID-Verbund mit mehrfacher Redundanz und Backups an verschiedenen Standorten zur Verfügung. Zur schnellen Entwicklung von Forschungssoftware steht ein CI-System zur Verfügung.
Für den Zugriff auf die Serverinfrastruktur sind Forschungsrechner auf Basis der x86-64 Architektur, ausgestattet mit verschiedenen Betriebssystemen (Windows, Linux, MacOS) verfügbar.
Ansprechperson
Prof. DI Dr. Nikolaus Augsten
Research Services
Systeme und Algorithmen für die Datenverarbeitung
Speicherung und Verarbeitung von großen Datensätzen
GIS-Datenbanken
Vernetzte Clusternodes mit 10 Gbit/s Ethernet und 2x 56Gbit/s Infiniband (pro Node)
Direkter Zugriff auf die Infiniband-Hardware für Software und Dienste mit RDMA-Unterstützung
Abstrahierung und Isolation von laufenden Systemen mittels Virtualisierung und Containertechnologien
Methoden & Expertise zur Forschungsinfrastruktur
Die Forschungsinfrastruktur ist für die Forschung im Bereich Data Engineering ausgelegt mit dem Ziel, Effizienzprobleme in der Datenverarbeitung zu lösen. In diesem Forschungszweig werden neue Algorithmen entwickelt, implementiert und empirisch evaluiert. Die empirische Evaluierung erfordert präzise Laufzeitmessungen, Messungen des Speicherverbrauchs, sowie des Netzwerkverkehrs. Dazu ist meist ein exklusiver und physischer Zugang (Bare Metal) zu einzelnen Servern oder einem Cluster von Servern notwendig. Die Nutzung ist charakterisiert durch häufig sich ändernde Konfigurationen um Tests unter verschiedenen Bedingungen ausführen zu können.
Die Forschungsinfrastruktur wird technisch professionell administriert und bietet unterstützende Services für die Ausführung von Experimenten, z.B. versionierte Speicherung von experimentellen Setups und großen experimentellen Daten, E2EE für sensible Forschungsdaten, vollautomatische Provisionierung der Cluster Nodes, sowie Datenbanken für Messergebnisse. Forscher und Forscherinnen werden beim Setup ihrer Experimente vom technischen Personal unterstützt und beraten. In wissenschaftlicher Hinsicht besteht ein ausgeprägter Erfahrungsschatz im Design und der empirischen Evaluierung von single-core, multi-core und parallelen sowie verteilten shared-nothing Algorithmen.
Johannes Gutenberg Universität Mainz (JGU)
Technische Universität München
Celonis SE, München
Findologic GmbH, Salzburg
Salzburg Research Forschungsgesellschaft m.b.H.
2022 - 2026
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://dbresearch.uni-salzburg.at/projects/desq/index.php
BOSS 1.0: Biblical Online Synopsis Salzburg 1.0
2021 - 2024
Univ. Prof. Nikolaus Augsten, Ass.-Prof. Martin Schäler, Univ. Prof. Kristin De Troyer
Land Salzburg
https://dbresearch.uni-salzburg.at/projects/
Fast and Flexible Tree Edit Distance (FFTED) Projekt
2017-2021
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://ffted.dbresearch.uni-salzburg.at/
FWF Doctoral College GIScience
2015-2019
Nikolaus Augsten, Euro Beinat, Stefan Lang, Franz Neubauer, Anette Bartsch, Thomas Blaschke, Michael Leitner, Josef Strobl
Fonds zur Förderung der wissenschaftlichen Forschung: FWF
https://dk-giscience.zgis.net/
Synonyme für Suchmaschinen
2018-2019
Univ. Prof. Dipl.-Ing. Nikolaus Augsten, PhD
Findologic GmbH, Österreichische Forschungsförderungsgesellschaft mbH
A Relational Matrix Algebra and its Implementation in a Column Store. SIGMOD Conference 2020: 2573-2587
https://doi.org/10.1145/3318464.3389747
Thomas Hütter (Univ. Salzburg), Maximilian H. Ganser (Univ. Salzburg), Manuel Kocher (Univ. Salzburg), Merima Halkic (Univ. Salzburg), Sabine Agatha (Univ. Salzburg), Nikolaus Augsten (Univ. Salzburg):
DeSignate: detecting signature characters in gene sequence alignments for taxon diagnoses. BMC Bioinform. 21(1): 151 (2020)
https://doi.org/10.1186/s12859-020-3498-6
Set Similarity Joins on MapReduce: An Experimental Survey
2018
Fabian Fier (Humboldt-Universität zu Berlin), Nikolaus Augsten (Univ. Salzburg), Panagiotis Bouros (Johannes Gutenberg University Mainz), Ulf Leser (Humboldt-Universität zu Berlin), Johann-Christoph Freytag (Humboldt-Universität zu Berlin) PVLDB 11(10): 1110-1122
https://doi.org/10.14778/3231751.3231760
An Empirical Evaluation of Set Similarity Join Techniques
2016
Willi Mann (Univ. Salzburg), Nikolaus Augsten (Univ. Salzburg), Panagiotis Bouros (Aarhus Univ., Denmark) PVLDB 9(9): 636-647
https://doi.org/10.14778/2947618.2947620
On-the-fly token similarity joins in relational databases
2014
Nikolaus Augsten (Univ. Salzburg), Armando Miraglia (VU Amsterdam), Thomas Neumann (TU München), Alfons Kemper (TU München) SIGMOD Conference 2014: 1495-1506
https://doi.org/10.1145/2588555.2610530
JEDI: These aren't the JSON documents you're looking for?
2022
Thomas Hütter, Nikolaus Augsten, Christoph M. Kirsch, Michael J. Carey, Chen Li
SIGMOD Conference 2022: 1584-1597
https://doi.org/10.1145/3514221.3517850
Scaling Density-Based Clustering to Large Collections of Sets
2021
Daniel Kocher, Nikolaus Augsten, Willi Mann
EDBT Conference 2021: 109-120
https://doi.org/10.5441/002/edbt.2021.11
Swellfish privacy: Supporting time-dependent relevance for continuous differential privacy
2022
Christine Tex, Martin Schäler, Klemens Böhm
Information Systems Journal 109
https://doi.org/10.1016/j.is.2022.102079
Set Similarity Joins on MapReduce: An Experimental Survey.
2018
Fabian Fier, Nikolaus Augsten, Panagiotis Bouros, Ulf Leser, Johann-Christoph Freytag
PVLDB 11(10): 1110-1122
https://doi.org/10.14778/3231751.3231760
Tree edit distance: Robust and memory-efficient.
2016
Mateusz Pawlik, Nikolaus Augsten
Inf. Syst. 56: 157-173
https://doi.org/10.1016/j.is.2015.08.004
An Empirical Evaluation of Set Similarity Join Techniques.
2016
Willi Mann, Nikolaus Augsten, Panagiotis Bouros
PVLDB 9(9): 636-647
https://doi.org/10.14778/2947618.2947620
On-the-fly token similarity joins in relational databases.
2014
Nikolaus Augsten, Armando Miraglia, Thomas Neumann, Alfons Kemper
SIGMOD Conference 2014: 1495-1506
https://doi.org/10.1145/2588555.2610530