3.3 Untersuchervariabilität
Unter dem Begriff Untersuchervariabilität versteht man die unterschiedliche Beurteilung desselben Objektes durch mehrere verschiedene Untersucher.
Wie bei jeder anderen diagnostischen Methode in der Medizin, gibt es auch bei der Dermatoskopie keine 100%ige Diagnosegenauigkeit. Um die Diagnosegenauigkeit zu bestimmen, wird der entsprechende diagnostische Test mit der jeweiligen Referenzmethode als Goldstandard verglichen und danach beurteilt. Auf dem Gebiet der Diagnostik von Pigmentläsionen ist dieser Goldstandard die Histopathologie. Das Problem ist, dass bereits hierbei die Referenzmethode eine sehr große Untersuchervariabilität aufweist.
Um die Untersuchervariabilität zu bestimmen, wird ein Patient oder ein Muttermal von mehreren Untersuchern begutachtet und die Diagnosen miteinander verglichen. Im Bereich der Diagnostik von Pigmentläsionen existieren verschiedene Arten von Untersuchervariabilitäten.
3.3.1 Welche Läsionen werden bei einem Patienten untersucht?
Die ersten Unterschiede bestehen bereits darin, welche der Muttermale von den Untersuchern genauer angesehen werden. Bei einem Patienten mit wenigen, sehr ähnlichen Muttermalen und einem isolierten Muttermal, welches sich deutlich von den anderen unterscheidet, wird es wohl zu einer sehr großen Übereinstimmung zwischen den Untersuchern kommen, da alle sich das Muttermal genau ansehen werden, welches sich von den anderen unterscheidet (Zeichen des "hässlichen jungen Entleins" [Grob JJ 1998]). Bei einem Patienten mit einer großen Anzahl von Muttermalen, von denen jedes beunruhigend aussieht (s. Abb. 3.17), wird jeder Untersucher seine eigenen Kriterien bei der Auswahl der näher zu untersuchenden Läsionen anwenden. Es wird also zu einer deutlich größeren Untersuchervariabilität kommen. Zu diesem Thema gibt es keine systematischen Untersuchungen. Wir haben vor kurzem eine klinische Studie durchgeführt, bei der Patienten nacheinander von mehreren Untersuchern mit unterschiedlicher Erfahrung untersucht wurden. Diese Studie wurde bei Hochrisikopatienten in einer Spezialsprechstunde durchgeführt. Mittels eines Handzählers haben wir gezählt, wie viele Muttermale sich die Untersucher bei einem Patienten angesehen haben. In dieser nichtrepräsentativen Pilotstudie fanden wir, dass ein Untersucher mit weniger Erfahrung sich deutlich mehr Läsionen pro Patient ansieht als ein erfahrener Untersucher.
3.3.2 Wie wird eine Läsion von verschiedenen Untersuchern interpretiert?
Die wohl aussagekräftigste Literatur hierzu kommt aus dem Bereich der Teledermatoskopie, da dort verschiedene Untersucher mit sehr unterschiedlichem Background dieselbe Läsion beurteilen. Hier sind speziell 2 Arbeiten zu erwähnen: In der ersten Arbeit hat ein italo-österreichisches Autorenteam die vor Ort-Diagnose in Italien mit der Telediagnose in Österreich verglichen und konnte zeigen, dass die Untersuchervariabilität ganz klar vom "diagnostischen Schwierigkeitsgrad" einer Läsion abhängt [Piccolo D 1999]. Läsionen mit einem geringen diagnostischen Schwierigkeitsgrad (egal ob gutartig oder bösartig) wurden von allen Teilnehmern richtig diagnostiziert.
In einer 2. Studie derselben Autoren wurden 43 Läsionen an 10 unterschiedlichen Zentren telemedizinisch untersucht und mit der vor Ort gestellten Diagnose verglichen [Piccolo D 2000]. In dieser Studie bestätigten sich zum einen die Erfahrungen der ersten Studie. Zum anderen konnte gezeigt werden, dass die Untersuchervariabilität bezüglich der Diagnosen sowie die Diagnosegenauigkeit klar von der Erfahrung des jeweiligen (Tele-)Untersuchers abhing. Die Experten erzielten zum Teil bessere Ergebnisse als die Kollegen, die den Patienten vor Ort gesehen hatten.
Dies wurde kürzlich in einer weiteren Arbeit österreichischer Autoren bestätigt, die die Frage nach der Diagnosegenauigkeit der Dermatoskopie mittels einer Meta-Analyse untersucht haben [Kittler H 2002]. Die Verwendung von Dermatoskopie durch unerfahrene Untersucher brachte keinen Zugewinn an Diagnosegenauigkeit. Diese lag vielmehr im Bereich der klinischen Untersuchung (ohne Dermatoskopie) und je nach Studie sogar noch darunter. Bei erfahrenen Untersuchern lag diese jedoch deutlich darüber.
Die wohl wichtigste Referenz zu diesem Thema ist der Artikel von Argenziano et al., der die Ergebnisse der letzten Konsensus-Konferenz zur Dermatoskopie zusammenfasst [Argenziano G 2003]. Im Rahmen dieser Konsensus-Konferenz, die über das Internet durchgeführt wurde, wurden insgesamt 108 histologisch gesicherte Läsionen von 40 Experten aus dem Bereich der Dermatoskopie beurteilt. Hierbei wurden dermatoskopische Kriterien sowie 4 diagnostische Algorithmen evaluiert. Abschließend wurde eine Diagnose gestellt und eine Therapieempfehlung abgegeben.
Abb. 3.17: Übersichtsaufnahme des Rückens einer Patientin mit einem dysplastischen Nävus-Syndrom. Bei diesen Patienten ist die Untersuchervariabilität wesentlich größer.
Es fand sich, dass die Übereinstimmung bezüglich der einzelnen dermatoskopischen Kriterien selbst unter Experten auf dem Gebiet lediglich "ausreichend" war. Hingegen war diese für die diagnostischen Algorithmen wie 7-Punkte-Checkliste, ABCD-Regel der Dermatoskopie, Musteranalyse und Menzies-Methode "gut". Die Musteranalyse erzielte die besten Resultate. Bezüglich der Therapieempfehlung (Exzision, Follow-up, keine weitere Therapie) war die Übereinstimmung der Experten ziemlich "gut" mit mittleren Kappa-Werten von 0,53.
In einer weiteren, kürzlich erschienenen Studie verglichen die italienischen und österreichischen Autoren die Untersuchervariabilität der Dermatoskopie mit der der Pathologie anhand einer Serie von 107 pigmentieren Läsionen [Ferrara G 2002]. Die Läsionen wurden jeweils von 8 Dermatoskopikern und 8 Histopathologen untersucht. In beiden Gruppen fand sich eine gute Übereinstimmung bezüglich der Diagnose. Statistisch gesehen waren die Histopathologen noch etwas besser als die Dermatoskopiker. Die Autoren konnten ebenfalls belegen, dass in den Fällen, in denen sich die Dermatoskopiker uneinig waren, es auch immer zu Meinungsverschiedenheiten unter den Pathologen kam.
3.3.3 Fazit
Die Untersuchervariabilität hängt von vielen Faktoren ab und fängt bereits mit der Auswahl der untersuchten Läsionen an. Die Untersuchervariabilität bezüglich einer gegeben Läsion hängt vom diagnostischen Schwierigkeitsgrad der Läsion und vor allem der Erfahrung des Untersuchers ab.
|