Wie funktioniert die 'Materialized View' Implementierung in Amazon Redshift im Vergleich zu Standard-Views?

Standard-Views in Amazon Redshift fungieren als gespeicherte Abfragen. Bei jedem Aufruf führt das System die zugrunde liegende SQL-Logik erneut aus. Dies garantiert maximale Datenaktualität, führt jedoch bei komplexen Joins oder Aggregationen über große Datenmengen zu hohen Latenzen und einer steigenden CPU-Last auf dem Cluster.

Materialized Views (MV) hingegen speichern das Ergebnis der Abfrage physisch auf dem Datenspeicher. Anstatt die Logik bei jedem Zugriff neu zu berechnen, liest Redshift die bereits vorberechneten Daten. Dies reduziert die Abfragezeit drastisch, da rechenintensive Operationen nur während des Refresh-Prozesses durchgeführt werden.

MerkmalStandard ViewMaterialized View
DatenspeicherungKeine (nur Logik)Physisch auf Disk
AbfragegeschwindigkeitAbhängig von KomplexitätHoch (Pre-computed)
DatenaktualitätEchtzeit (Live)Bis zum letzten Refresh
RechenlastBei jedem Read-ZugriffPrimär beim Refresh

Ein technischer Vorteil der Materialized Views in Redshift ist das automatische Query Rewriting. Der Optimizer erkennt, wenn eine Abfrage auf Basistabellen durch eine vorhandene MV beschleunigt werden kann, und leitet den Zugriff automatisch auf die MV um, ohne dass der Anwender den SQL-Code anpassen muss.

Die Aktualisierung der Daten erfolgt über den Befehl REFRESH MATERIALIZED VIEW. Redshift unterstützt dabei inkrementelle Refreshes, sofern die Abfrage bestimmte Kriterien erfüllt (beispielsweise keine Outer Joins oder Window Functions). Dadurch müssen nicht alle Daten neu berechnet werden, was die Last auf dem Cluster minimiert. Bei der Planung solcher Datenarchitekturen unterstützen wir Unternehmen im Rahmen unseres IT-Consulting & Digitale Strategie, um die Balance zwischen Speicherkosten und Performance zu optimieren.

Wir empfehlen den Einsatz von Materialized Views konsequent für alle aggregierten Dashboards und komplexen Reporting-Queries, da die geringen zusätzlichen Speicherkosten gegenüber den massiven Performance-Gewinnen und der reduzierten Cluster-Last vernachlässigbar sind.

Sergej Wiens

Sergej Wiens

Gründer & Software Architekt