Themen für Abschlussarbeiten
Am Ende Ihres Bachelor- Diplom- oder Masterstudiums fertigen Sie eine Abschlussarbeit an, um den jeweiligen akademischen Grad zu erlangen. Der erste Schritt Ihrer Abschlussarbeit ist die Themenfindung. Hierbei ist es wichtig, dass Sie ein Thema finden, dass für Sie (sehr) interessant ist und an Ihre praktische Tätigkeiten anknüpft. Ziel einer wissenschaftlich orientierten Arbeit ist ein Erkenntnisgewinn (aufklären statt erklären).
Die Themenfindung ist Teil des Studiums, so das kein Themenkatalog bereitgestellt wird. Im Folgenden finden Sie dennoch eine Auswahl aktueller Themen, die Sie aufgreifen können. Es besteht die Möglichkeit, dass die dargestellten Inhalte der Themen abgeändert werden können. Wenn Sie Ihre Abschlussarbeit zu einem der Themen verfassen möchten oder einen eigenen Themenvorschlag haben, dann kontaktieren Sie mich und wir werden in einem individuellen Gespräch ein passendes Konzept erarbeiten. Das Konzept und der Titel der Arbeit wird in einer Disposition (Exposé) dokumentiert, womit Sie die Arbeit anmelden. Anregungen finden Sie auch im Archiv vergangener Abschlussarbeiten.
Eine Auswahl von nützlichen Dokumenten können Sie über der Link in der linken Spalte finden.
Bei der Übertragung von Daten zwischen Anwendungen werden häufig kompakte, semistrukturierte Datenformate wie JSON, XML oder CSV eingesetzt. Attribute können frei definiert werden, ohne dass Datentypen und Wertebereiche festgelegt werden müssen. Dies wird insbesondere beim Laden von großen Datenmengen in ein Data Warehouse (ETL) jedoch zum Problem. Für Auswertungen muss das Schema bekannt und möglichst einheitlich sein. Daten, die nicht in das Schema passen, werden entweder gar nicht oder unverändert gespeichert, so dass eine Schemadefinition und Strukturierung der Daten erst im Reporting manuell erfolgt. Hypothesen: Mit Hilfe von Large-Language-Models könnte es möglich sein, anhand von neuen Daten ein einheitliches Schema abzuleiten und dieses direkt zu nutzen, um abweichende Daten im ETL-Prozess nach diesem Schema automatisiert zu transformieren. Datenbank-Beladungen würden seltener fehlschlagen. Manuelle Transformationen würden weitgehend wegfallen.
Betreuung: Daniel Fritzler und Rüdiger Steffan
Kurzbeschreibung:
Oracle führt eine integrierte Vektordatenbank ein, um die generative KI zu erweitern und die Entwicklerproduktivität drastisch zu steigern. Durch die neue KI-Vektor-Ähnlichkeitssuche in Oracle Database 23c ist die Kombination von Suchverfahren in semantischen und Geschäftsdaten möglich, um schnell und sicher hochpräzise Antworten bereitzustellen [1]. Dies soll anhand geeigneter Fallstudien genauer untersucht und bewertet werden. Vergleich mit anderen Vektor-Datenbanken, integriert und nativ.
Betreuung: Rüdiger Steffan und ...
[1] Pressemitteilung: https://www.oracle.com/de/news/announcement/ocw-integrated-vector-database-augments-generative-ai-2023-09-19/
Kurzbeschreibung:
Kubernetes bietet Orchestrierung für das schnelle Provisioning containerisierter Datenbanken. Dies unterstützt schnellere Deployments durch vordefinierte Konfigurationen, Selbstüberwachung und Elastizität. Containerisierte Images können mit minimalem Aufwand genutzt und in der Cloud sowie in lokalen Umgebungen bereitgestellt werden [1].
Am Beispiel von Oracle und im Vergleich zu anderen Datenbanken sollen Best Practices experimentell und unter Einsatz der Virtualisierungsinfrastruktur der Fakultät für Wirtschaftswissenschaften, überprüft und bewertet werden. Ausrichtungen für Fallstudien:
- Oracle Database bietet die Kubernetes-API-Softwareerweiterungen mit benutzerdefinierten Ressourcendefinitionen und Controllern zur Automatisierung des Betriebs und der Lebenszyklusverwaltung von Datenbanken, die innerhalb und außerhalb von Kubernetes-Clustern bereitgestellt werden.
- In einer vorhergehenden Arbeit wurde die doppelte Virtualisierung für Oracle RAC untersucht. Oracle RAC in Docker ist eine Alternative, die genauer untersucht werden soll.
- Oracle Sharding on Kubernetes. Was bieten andere Datenbanken für diese Funktionalität? Dies soll anhand geeigneter Fallstudien genauer untersucht werden.
Betreuung: Rüdiger Steffan und ...
[1] www.oracle.com/de/database/kubernetes-for-container-database/
Kurzbeschreibung
Vorrangig sind die Verzeichnisdienste MS Active Directory (AD) und LDAP von Interesse (ohne Synchronisierung). Ein Dienst der AD nutzt ist beispielsweise Citrix. Dienste, die LDAP nutzen, sind beispielsweise Shibboleth oder MyOffice. Microsoft AD wird als VM bereitgestellt. LDAP soll selbst installiert bzw. eingerichtet werden. Ziel ist es, eine Zwei-Faktor-Authentifizierung prototypisch einzurichten und zu testen. Vergleich mit AD in der Cloud (Azure AD) mit Kostenrechnungen sowie mögliche Fallstricke einer 2FA simulieren und testen.
Betreuung: Rüdiger Steffan und Thomas Kästner
Kurzbeschreibung
Ziel der Arbeit ist ein experimenteller Vergleich der Installation von DirectusCMS direkt in einer virtuellen Maschine (VM) und in einem Docker-Container innerhalb einer VM (verschachtelte Virtualisierung). VMs werden in der Infrastruktur der Hochschule bereitgestellt, die verwendet werden sollen. Zwei getrennte Installationen von DirectusCMS, mit und ohne Docker. Experimente zur Beschreibung/Diskussion der Vor- und Nachteile beider Strategien.
Betreuung: Rüdiger Steffan und Thomas Kästner
Kurzbeschreibung
Cloud Computing wird häufig bezüglich Datenschutz betrachtet. Interessant sind aber auch die "massiven" Emissionseinsparungen gegenüber klassischen Rechenzentren. Oder stimmt das gar nicht? Interessant wären hier die Vergleiche und die Quantifizierung der Einsparungen. Beispiele: Google Cloud nutzt heute schon 100% erneuerbare Energien. Amazon Cloud möchte 2025 dort hinkommen.
Betreuung: Daniel Fritzler und Rüdiger Steffan
Kurzbeschreibung
Die EU verpflichtet Großunternehmen beginnend im Oktober 2022 zum "EU sustainability reporting". Damit sollen dann die Nachhaltigkeitsziele und Maßnahmen standartisiert berichtet werden. Grundsätzlich ein eher juristisches und buchhalterisches Thema, doch es inkludiert auch das Ausweisen von CO2-Emissionen. Kann man das mit Hilfe von Business Intelligence automatisieren? Rechnet man einfach Kilowattstunden in CO2-Äquivalente um oder gibt es da noch mehr zu beachten?
Wie betrachtet man Hardwareinvestitionen? Speziell für Datenbanken: Könnte es ein Reporting geben, dass SQL-Tuning auch in Hinblick auf CO2-Einsparung optimiert? Im Jahre 2025 wird ein weniger strenges "sustainability reporting" dann auch von KMU's von der EU gefordert.
Betreuung: Daniel Fritzler und Rüdiger Steffan
Kurzbeschreibung
Speziell für Big Data ist auch einen Rebound-Effekt zu befürchten. Der Rebound-Effeckt sagt aus, dass energieffizente Einsparung schnell wieder “aufgefressen“ werden. Beispiel: Energieffizente Fahrzeugtechnologie begünstigte SUVs statt das 3-Liter-Auto. Durch Cloud-Datenbanken kann man "endlos" skalieren, hier besteht auch die Gefahr, dass Performance-Tuning kein Thema mehr sein wird und die CO2-Emissionen am Ende noch größer werden (siehe Studienskript Datenbanken in Unternehmen). Wie rechtfertigt man die Kosten eines DWH oder allgemein einer Information? Könnte man eine Formel entwickeln, um Informationen monetär zu bewerten, so dass man eine Funktion für das Kosten-/Nutzenverhältnis hat?
Betreuung: Daniel Fritzler und Rüdiger Steffan