Medikamenten-Graph

Author

Christian Franke

Published

July 15, 2025

Ein Graph-Modell mit Medikamenten-Daten in der Graph-Datenbank Neo4j war das Ergebnis meiner Bachelor-Thesis.

Summary

Die Graph-Datenbank mit öffentlich verfügbaren Informationen über hochteure Medikamente soll der SwissDRG AG helfen, Zusammenhänge zwischen Medikamenten und deren Indikationen einfacher zu erkennen. Die Daten wurden in Neo4j integriert und sollen bei der Weiterentwicklung der stationären Tarifsysteme im Schweizer Gesundheitswesen unterstützen. Ein kurzes Video gibt einen kompakten Einblick in das Projekt.

Problemstellung

Die Anzahl hochteurer Medikamente ist in den vergangenen Jahren deutlich gestiegen. Dabei ist es herausfordernd, ähnliche Indikationen für unterschiedliche Substanzen und die Verbindungen zwischen den Medikamenten im Überblick zu behalten. Besonders Graph-Datenbanken sind geeignet, um genau solche Relationen abzubilden. Mit Hilfe von Neo4j sollte ein Graph-Datenmodell erstellt werden. Die Daten stammen von der SwissDRG AG, der Spezialitätenliste (SL) des BAG, dem ATC-Index der WHO, der Europäischen Arzneimittelagentur sowie den strukturierten Arzneimittelinformationen der Stiftung Refdata. Dabei sollte es möglich sein, die öffentlichen Daten monatlich zu aktualisieren und bei Bedarf weitere Informationsquellen zu integrieren.

Ergebnis

Die Medikamentendaten wurden in 13 Labels gespeichert, die mit 14 unterschiedlichen Relationen-Typen miteinander verbunden sind. Es wurden über 27’000 Knoten und über 41’000 Relationen kreiert. Die Schemalosigkeit und Flexibilität von Graph-Datenbanken war speziell für die Knoten Substanz und Produkt wichtig. Zwischen diesen Knoten wurde die Relation HAT_ATC auch dann erstellt, wenn sich deren direkte ATC-Codes zwar unterschieden, aber gleichzeitig der indirekte ATC-Code der SL übereinstimmte. Defizitäre Datenqualität kann damit teilweise ausgeglichen werden. Die Datenbank wird in der SwissDRG AG zukünftig in einer Cloud-Umgebung eingesetzt, um beispielsweise Substanzen mit «gleicher» Indikation einfacher zu identifizieren und das Tarifsystem gezielt weiterzuentwickeln.

Medikamenten Datenmodell

Details

Den Source-Code findet Ihr in meinem GitHub-Repo. Wenn Ihr Details wissen möchtet, könnt ihr diese im Abschlussbericht in Ruhe nachlesen.