Articles

Objektive Beurteilung der Kleinhirnataxie: Ein umfassender und verfeinerter Ansatz

Comprehensive Objective Assessment (COA) System

In dieser Studie verwendeten wir BioKin17, eine Cloud-basierte Echtzeit-Motion-Capture-Sensor-Plattform, um eine umfassende objektive Beurteilung von CA durchzuführen. BioKin17 ist ein drahtloses tragbares Gerät mit einem eingebetteten triaxialen Beschleunigungsmesser (Modellchipsatz „MPU-9150“ von InvenSense, Inc., San Jose, CA, USA) und einen IEEE802.11b / g / n / drahtlose Kommunikationsschnittstelle, die auf einem 32-Bit-ARM-Prozessor ausgeführt wird. Das vom Networked Sensing and Control Lab der Deakin University entwickelte BioKin-Sensorsystem kann mit einer mobilen Android-Anwendung interagieren, um komplexe Bewegungen eines menschlichen Körpers in Echtzeit zu erfassen, wie in Abb. 1. Es ist optimiert, um Absetzeffekte und Probleme mit der Sensordrift zu reduzieren, indem Fehler bei der Ausrichtung der Leiterplattenachse zwischen den einzelnen Trägheitssensoren beseitigt17. Dieser Sensor wurde gegen ein herkömmliches optisches Bewegungsverfolgungssystem mit mehreren Kameras (Vicon System, T40S, Oxford, UK), ein hochpräzises Bench-Marking-System18, verglichen. BioKin erfasste die Gyroskop- und Beschleunigungsdaten in den dreidimensionalen (3D) kartesischen Koordinaten mit einer Abtastrate von 50 Hz. Die CA-Bewertung wurde in den folgenden Schritten durchgeführt:

  1. Bewegungseingaben, die durch neun instrumentierte Tests generiert wurden, die die neun klinischen Standardtests von CA am Krankenbett nachahmen, die die 5 Domänen abdecken.

  2. Diese werden von Sensoren erfasst und mit einer unterstützenden Applikation in einem Smartphone visualisiert.

  3. Drahtlose Übertragung an ein Blockchain-basiertes verteiltes Cloud-Netzwerk19, in dem Diagnose- und Bewertungsalgorithmen angewendet werden.

  4. Die Ergebnisse der Datenanalyse werden in ein klinisch relevantes Format umgewandelt.

Eine bildliche Darstellung der Sensorplattform ist in Fig. 1.

Bewegungseingabe

Die Probanden wurden dazu gebracht, neun klinische Standardtests durchzuführen; wiederholte Silbenäußerung (SPE), rhythmisches Fingerklopfen (FIN), Finger-Nase / Nasenfinger (FNT), Dysdiadochokinesie (DDK), ballistische Verfolgung / Fingerjagd (BAL), Ferse-Schienbein (HST), Fußklopfen (FOO), Haltung / Romberg (ROM) und Gang (WAL). Die Aufgaben werden inline mit den in SARA angegebenen Anweisungen ausgeführt, die alle 5 Domänen abdecken. Um Störfaktoren durch Schwanken während der Durchführung der Tests in sitzender Position zu vermeiden, erhielten die Teilnehmer axiale Unterstützung, d. H. Sie saßen bequem in aufrechter Sitzposition. Die Rückenlehnenstütze des Stuhls war um 90-100 Grad mit ausreichender Holzstütze im Einklang mit dem unteren Rücken abgewinkelt. Sowohl die rechte als auch die linke Extremität wurden untersucht.

Datenerfassung

Das COA-System verwendete in sieben Tests im BioKin-System ausgerüstete Inertialmesseinheiten (IMUs), um Translations- und Rotationskinematik in orthogonalen Achsen über Beschleunigungsmesser und Gyroskope zu erfassen. Eine Microsoft Kinect V2-Kamera mit einem 23-Zoll-Monitor und einem Mini-PC mit einem Intel Core i5-Prozessor wurde ebenfalls in einem der Tests für die markerbasierte Bewegungserfassung und zum Abrufen der absoluten Positionsinformationen verwendet.

Cloud-basierte Algorithmen

Die aufgezeichneten Daten werden dann über die drahtlose Verbindung zur anschließenden Datenverarbeitung an das Blockchain-basierte verteilte Cloud-netzwerk19 übertragen, sodass Ärzte Schweregrade erfassen können. MATLAB (R2019a, MathWorks) und Python-Umgebungen verarbeiteten die drahtlos übertragenen Daten.

Klinische Ausgabe

Die erfassten Daten werden über die Android-basierte Smartphone-Anwendung BioKin visualisiert, die Bewertungsberichte und Schweregrade als Ergebnis der Cloud-basierten Datenverarbeitung generiert.

In unserem COA-System beträgt der durchschnittliche zeitliche Aufwand für die Erfassung der Daten per Motion Capture von jedem der 6 peripheren Tests (DDK, FNT, FIN, BAL, FOO, HST) weniger als 15 Sekunden. Der Gleichgewichtstest (ROM) dauert weniger als 30 Sekunden; Der Gangtest (WAL) dauert weniger als 90 Sekunden, während der Sprachtest (SPE) weniger als 5 Sekunden benötigt, um Daten zu erfassen. Daher liegt der durchschnittliche zeitliche Aufwand für die Erfassung von Daten und die Generierung eines kumulativen Testergebnisses (unter Verwendung von Cloud-basierten Algorithmen) für einen einzelnen Patienten bei etwa 215 Sekunden bzw. 5 Sekunden. Das Testset dauert in der Regel bis zu 30 Sekunden.

Experimentelles Design

Teilnehmer

Für eine eingehende Analyse von Anomalien, die auf Timing, Stabilität, Genauigkeit und Rhythmik bei motorischen Bewegungen zurückzuführen sind, wurden Sprach- und Kinematikdaten von 34 Probanden aufgezeichnet, deren Muttersprache Englisch war. Dreiundzwanzig wurden zuvor mit einer Kleinhirnataxie (CA) aufgrund einer neurodegenerativen Erkrankung diagnostiziert und besuchten die neurologische Klinik am Royal Victorian Eye and Ear Hospital (RVEEH) oder Alfred Hospital in Melbourne. Elf normale Probanden (Kontrollen) waren Freiwillige ohne neurologische Erkrankungen oder andere Sprachstörungen in der Vorgeschichte. Eine Zusammenfassung der Kohortenstatistiken ist in Tabelle 1 wiedergegeben. Keiner der Teilnehmer (Kontrollen und CA) hatte sich vor dieser klinischen Untersuchung einem Rehabilitationsprogramm unterzogen. Keiner der Teilnehmer (Kontrollen und CA) hatte sich vor dieser klinischen Untersuchung einem Rehabilitationsprogramm unterzogen. Eine Überprüfung der Literatur20,21,22 ergab, dass das Erkrankungsalter, das Diagnosealter und andere demografische Faktoren das Alter und die GVO-Aktivität im Zusammenhang mit Ataxie nicht beeinflussen. Da unsere Studie auf eine erwachsene Ataxie-Kohorte beschränkt war, war die strikte Einhaltung der alters- und geschlechtsspezifischen Kriterien nicht möglich.

Tabelle 1 Klinische Charakterisierung der eingeschriebenen Teilnehmer.

Ethische Genehmigung und Zustimmung zur Teilnahme

Diese Studie wurde von der Human Research and Ethics Committee des Royal Victorian Eye and Ear Hospital, East Melbourne, Australien (HREC-Referenznummer: 11/994H/16) genehmigt und vom Florey Institute of Neuroscience and Mental Health, Melbourne, Australien, durch den National Health and Medical Research Council (NHMRC) GNT1101304 und APP1129595. Alle Methoden in dieser Studie wurden durchgeführt in Übereinstimmung mit den einschlägigen Richtlinien und Vorschriften und die schriftliche Zustimmung wurde von allen Teilnehmern vor ihrer Einschreibung eingeholt. Von beiden Probanden wurde eine Einverständniserklärung eingeholt, um die in Abb. 1.

Testprotokoll und Merkmalsextraktion

Die objektiven Bewertungen der neun neurologischen Tests sind in die folgenden 5 Domänen mit einer kurzen Beschreibung ihres Ausführungsprotokolls gruppiert. Eine Zusammenfassung der Merkmale, die sich in der entsprechenden Studie als entscheidend für die Diagnose von CA erwiesen haben4,6,7,8,9,10,11 ist auch für jeden Testunterabschnitt in Tabelle 2 eingeschlossen worden.

Tabelle 2 Kurze Beschreibung der Sterncharakterisierung der 172 Merkmale, die aus den 9 neurologischen Tests extrahiert wurden.

Speech

  • Wiederholte Silbenäußerung (SPE): Der Kandidat musste die Konsonant-Vokal-Silbe/ta/ für 5 Sekunden mit seiner bevorzugten Geschwindigkeit wiederholen. Die Aufnahmen wurden mit einem Kondensatormikrofon in einem ungefähren Abstand von 10 cm vom Mund des Probanden in einem ruhigen Raum mit niedrigem Umgebungsgeräuschpegel aufgenommen. Ein Android-Handy mit dem Programm BioKinMobi unter Aufsicht eines professionellen Ermittlers hat die Rede aufgenommen. Ein auf topografischer Prominenz basierender automatisierter Algorithmus wurde verwendet, um sechs akustische Merkmale aus dem Zug wiederholter / ta / Silbenäußerungen zu extrahieren4,6.

  • Die Regelmäßigkeit der Dauer misst die Variabilität im Rhythmus der wiederholten/ ta/ (RT) -Äußerung. Dies wird als integrales Maß für Timing-Defizite identifiziert, die aus den Wellendaten bei 50% Prominenz extrahiert werden.

  • Gap regularity misst die Zeitdifferenzvariabilität zwischen zwei aufeinanderfolgenden/ta/ Silbenpeaks.

  • Average peak prominence gemessen die durchschnittliche relative Höhe/Spitze für einen bestimmten /ta/ Puls betrachtet.

  • Die Kompensationsregularität misst die Variabilität der Differenzen, die zwischen dem Peak und seiner entsprechenden Prominenz für einen bestimmten / ta / Silbenpuls berechnet wurden.

  • Dämpfungsverhältnis gemessen der Durchschnitt der Dämpfungsverhältnisse der /ta/ Silben, berechnet aus den Wellendaten, die bei 75% Prominenz extrahiert wurden.

  • Resonanzfrequenz gemessen der Durchschnitt der Resonanzfrequenz der /ta/ Silben, berechnet anhand der Wellendaten, die bei 50% Prominenz extrahiert wurden.

Obere Extremität

  • Rhythmischer Fingerklopftest (FIN): Die Teilnehmer klopften rhythmisch mit ihrem Zeigefinger gegen eine horizontale Oberfläche (z. B. Tischplatte) mit ihrer bevorzugten Geschwindigkeit und Dauer. Zur Datenerfassung wurde ein BioKin an der Rückseite des Zeigefingers angebracht. Die ersten 3 Hauptkomponenten (PC) der Multiskalenentropie, gemessen von den X- und Z-Achsen der Beschleunigungsmessersignale und der X-Achse der Gyroskopsignale, und der Variationskoeffizient des Inter-Tap-Intervalls, der die Unregelmäßigkeit des Rhythmus misst, waren die ausgewählten Merkmale7.

  • Finger-Nasen-Test (FNT): Die Teilnehmer mussten ihre Nase mit ihrem spitzen Zeigefinger berühren und dann mit demselben Finger den Finger des Klinikers berühren, der sich etwa 25 cm von der Nase des Probanden entfernt befand. Die Handbewegungen wurden mit einem BioKin gemessen, das am Handrücken des Zeigefingers befestigt war. Resonanzfrequenz und Amplitude bei Resonanzfrequenz waren die kritischen Merkmale8, die vom BioKin erfasst wurden, das an der Handfläche des Zeigefingers befestigt war. Die Frequenzbereichsbeschreibung von Beschleunigung und Winkelgeschwindigkeit wurde verwendet, um die Resonanz in jeder orthogonalen Achse (X, Y und Z) 8 zu erfassen.

  • Dysdiadochokinesie-Test (DDK): Die Teilnehmer mussten den Rücken einer Hand auf die Handfläche der anderen Hand legen, wie in Abb. 1. Die Teilnehmer wurden dann angewiesen, ihre Hand zu pronieren, so dass die Handfläche nach unten zeigt, um auf der Handfläche der anderen Hand zu ruhen. Das Subjekt wird auch angewiesen, abwechselnd zwischen diesen beiden Positionen so schnell und präzise wie möglich zu pronieren und zu supinieren. Die Wechselrate wird aus der am Handgelenk befestigten IMU des Biokins extrahiert. Dieser Test untersuchte die Unfähigkeit, Bewegungen zu koordinieren. Die Änderungsrate von Pronat und Supinat, Resonanzfrequenz und Amplitude bei Resonanzfrequenz waren die kritischen Merkmale8.

  • Ballistisches Tracking (BAL): Die Teilnehmer mussten auf einem Bildschirm auf das Ziel zeigen. Die Bewegung des Zeigefingers wurde mit der Kinect-Kamera erkannt und als Markierung auf dem Bildschirm dargestellt. Ziel ist es, dem Ziel über die projizierte Markierung (mit der Kinect-Kamera) auf dem Bildschirm genau zu folgen, wenn sich das Ziel schnell und zufällig von Punkt zu Punkt auf dem Monitor bewegt. Die folgenden extrahierten Merkmale zeigten ein signifikantes Maß an Korrelation mit dem Behinderungsgrad, der durch das klinische Standardmaß SARA9 erfasst wurde:

  • Fehler: Der Abstand zwischen Marker- und Zieltrajektorien, gemessen mit der Dynamic Time Warping-Methode in der horizontalen (H) und vertikalen (V) Achse.

  • Umfassende Zeitverzögerung: Dies wurde als Kreuzkorrelation für die zweimalige Sequenz, Marker und Ziel berechnet.

  • Kinematische Verzögerung: Dies wurde unter Verwendung des Index der Leistungsmessung im Fitts-Gesetz erhalten. Die Funktion besteht darin, die Leistung des Probanden beim Erreichen einer Zielposition zu messen.

  • Richtungsänderung in H- und V-Achse: Dies ist die Anzahl der Beschleunigungsänderungen, die der Teilnehmer in Bezug auf die Richtungsänderung gemessen hat. Diese Funktion enthielt Informationen zum Über- / Unterschreiten sowie zur Leistung des Probanden während des Tests. Ein höheres Maß an Dysmetrie ergab eine größere Fehlerrate gemäß der Differenz zwischen dem Ziel und den Markertrajektorien.

Untere Extremität

  • Fersen-Schienbein-Test (HST): Die Teilnehmer mussten eine Ferse auf das gegenüberliegende Knie legen und entlang der Tibia zwischen Ferse und Knie laufen wiederholt und so genau wie möglich. Das BioKin wurde am Fußrücken befestigt. Resonanzfrequenz und Amplitude bei Resonanzfrequenz waren die kritischen Merkmale8.

  • Rhythmisches Fußklopfen (FOO): Die Teilnehmer mussten jeden Fuß rhythmisch gegen eine horizontale Fläche (z. B. Boden) klopfen. Die ersten 3 Hauptkomponenten (PC) der Multiskalenentropie, gemessen von den X- und Z-Achsen der Beschleunigungsmessersignale und der X-Achse der Gyroskopsignale, und der Variationskoeffizient des Inter-Tap-Intervalls, der die Unregelmäßigkeit des Rhythmus misst, waren die ausgewählten Merkmale7.

Balance

  • Romberg-Test (ROM): Die Teilnehmer mussten so lange wie möglich mit den Füßen zusammen und dann mit den Füßen auseinander und den Armen an den Seiten stehen (bis zu 30 Sekunden); zuerst mit offenen Augen und dann mit geschlossenen Augen. Ein BioKin wurde mittels eines elastischen Neoprengürtels annähernd am Xiphisternum positioniert. Das zweite BioKin wurde an der Stelle des oberen Rückens in der Mittellinie direkt unter dem Nacken angebracht. Die Fuzzy-Entropie-Technik wurde für die posturale Schwankungsgeschwindigkeit verwendet, die aus den gemessenen Trunkenbeschleunigungen abgeleitet wurde. Die Entropiewerte 23 der abgeleiteten Geschwindigkeit wurden in erster Linie als Maß für die neuronale Motorsteuerung während einer ruhigen Standhaltung betrachtet, von der ein signifikanter Teil proportional zur Körperwechselgeschwindigkeit ist. Die Unsicherheit bei der Geschwindigkeitsmessung enthielt ein signifikantes Maß an Informationen in Bezug auf die Trunkeninstabilität.10.

Gang

  • Gangtest (WAL): Die Teilnehmer mussten 5 Meter gehen und zurückkehren, was 10 mal wiederholt wurde. Die Bewegungen des Probanden wurden von den eingebauten Trägheitssensoren eines Smartphones erfasst, das am Xiphisternum mittels eines elastischen Neoprengürtels und zweier BioKin-Sensoren befestigt war, die an jedem Knöchel befestigt waren. Der Sensor wurde so positioniert, dass seine X-, Y- und Z-Achsen ML- (medial-laterale), AP- (antero-posteriore) bzw. In jeder orthogonalen Achse (X, Y und Z) wurde die Frequenzbereichsbeschreibung verwendet, um die Resonanz zu erfassen11. Für jedes Subjekt wurden die Größe und die Resonanz in jeder Achse verwendet, um einen Merkmalsvektor zu bilden. Ein weiteres Merkmal, das Fuzzy Entropy-based velocity irregularity measure for truncal anomality (VI), wurde in der Studie ausgewählt11, um die Gangzufälligkeit oder das Unsicherheitsniveau während des Gehens zu messen. Die Studie in23 führte Fuzzy-Entropie (FuzzyEn) ein, um trunkale Ataxie zu erfassen.

In Bezug auf die in unsere Studie eingeschriebene ataxische Kohorte für Personen mit einem SARA–Score 7 für das Gehen – in dem Fall, in dem eine Ganghilfe erforderlich ist, wird der Patient gebeten, den Test mit der entsprechenden Ganghilfe (d. H. einem Einpunktstock oder einem Vierradrahmen (4WF)) durchzuführen.

Ataxic dimensions (STAR)

Den Arbeiten von Gordon Holmes wird oft ein grundlegender Einfluss auf unser Verständnis der klinischen Symptome und Anzeichen von Kleinhirnläsionen2,3,24 zugeschrieben. In unserer Studie haben wir Holmes ‚Ansatz zur Charakterisierung der Bewegung von Probanden mit Kleinhirndysfunktion in Bezug auf vier Dimensionen (Stabilität, Timing, Genauigkeit & Rhythmizität) überarbeitet.

  • Stabilität (En): Dies bezieht sich auf die Stabilität in der Plattform (der Ausführung). Die Plattform sind die Gelenke und Muskeln, die relativ fest sind und es dem sich bewegenden Körperteil ermöglichen, eine Aufgabe genau auszuführen. Zum Beispiel erfordert die DDK-Aufgabe eine relative Stabilität der Schulter- und Ellbogenflexion und -extension für eine effiziente Ausführung. Relative Instabilität führt zu einer Zunahme unnötiger Bewegungen in Sekundärachsen.

  • Timing (T): Wenn CA vorhanden ist, weisen Aufgaben mit einer Zeitbeschränkung wie BAL normalerweise eine erhöhte Latenz auf, bevor die Bewegung beginnt, und die Aufgabe wird mit einer langsameren Geschwindigkeit ausgeführt, da ein weniger direkter Kurs genommen wird. Die gleichen Merkmale sind oft auch ohne zeitliche Einschränkungen erkennbar. Diese Merkmale werden deutlicher, wenn die CA schwerwiegender ist, was darauf hindeutet, dass das Timing unbewusst ein neutraler Kompromiss ist, um die Aufgabe abzuschließen. Rechnerisch haben wir es als den Fehler zwischen dem Ziel und dem Erreichten erkannt, der wahrscheinlich von den folgenden beiden beeinflusst wird:

  • Zeit für das Subjekt, einen Moment einzuleiten.

  • Zeit zum Ausführen einer Bewegung (Geschwindigkeit).

    • Genauigkeit (A): Konzeptionell kann eine Aufgabe langsam abgeschlossen werden, aber dem effizientesten Ziel folgen. Unter diesen Umständen werden wir dies als „genaue“ Leistung betrachten. Wenn ein weniger direkter Pfad befolgt wird (z. B. in der BAL-Aufgabe) oder ein Unter- oder Überschuss vorliegt, wird die Aufgabe mit einer Steuerleistung verglichen (wobei anerkannt wird, dass dies auch mit Zeitfehlern verbunden sein kann). Rechnerisch erkennen wir es in dieser Studie als Fehler zwischen den Ziel- / Raumzielen und dem, was in einem räumlichen Kontext (statisch) erreicht wird.

    • Rhythmizität (R): Unregelmäßigkeit bei wiederholten Bewegungen.

Die Merkmale für jeden Test in unserem vorgeschlagenen COA-System werden den oben genannten Dimensionen durch den folgenden 2-stufigen Ansatz zugewiesen:

  1. (a) Die Ausführungsachse ist die Richtung der Primärbewegung, die zur Ausführung der beabsichtigten Aufgabe erforderlich ist, und würde der Rhythmik oder der Zeitdimension zugeordnet.

    (b) Jede Abweichung vom effizientesten oder Standardpfad, der zur Ausführung der Aufgabe erforderlich ist, wird als Genauigkeitsmerkmal betrachtet.

  2. Übermäßige Bewegungen in den anderen Achsen würden als sekundäre Bewegungen betrachtet und der Stabilitätsdimension zugeschrieben.

Eine bildliche Darstellung in Fig. 2 veranschaulicht die Sterninterpretation für jede Domäne gemäß dem vorgeschlagenen 2-Stufen-Ansatz.

Abbildung 2

Sternkennzeichnungskriterien.

Bei sich wiederholenden Tests (DDK, FNT, FIN, FOO, HST) trägt die Resonanzfrequenz entlang der y-Achse (Primär) zur Geschwindigkeit bei und wird daher als Zeitmerkmal betrachtet, während die Größe der Resonanz als rhythmisches Merkmal betrachtet wird. Die in anderen Achsen vorhandenen sekundären Bewegungen/Störungen werden als Stabilitätsmerkmale bezeichnet.

Bei zielbasierten Tests (BAL) wird jede Verzögerung bei der primären Bewegung der Verfolgung des Ziels als Zeitmerkmal betrachtet; wie gut ein Ziel erreicht wird oder welcher Grad an Abweichung beim Erreichen des Ziels die Leistung des Teilnehmers definiert und damit die Genauigkeit misst; Alle anderen Merkmale, die zu übermäßigen / ineffizienten Bewegungen führen, sind unter Stabilität gekennzeichnet.

Der Gangtest besteht darin, in einer geraden Linie (entlang der AP-Achse) in einem regelmäßigen Tempo vorwärts zu gehen, indem jeder Fuß rhythmisch angehoben und abgesetzt wird. Dies würde Rhythmizitätsinformationen ableiten, während das Ausmaß der verkürzten Schwankung von der AP-Achse (dh Bewegung in der ML-Achse) Genauigkeitsinformationen ableiten würde. Darüber hinaus wird ein unerwünschtes Schwanken in der VT-Achse als Stabilitätsmerkmal betrachtet.

Für den Gleichgewichtstest wird von einem Teilnehmer erwartet, dass er eine stabile gerade Haltung entlang seiner VT-Achse beibehält. Da dies ihre primäre Bewegung ist, wird jede Abweichung oder Schwankung in der VT-Achse für Ungenauigkeiten verantwortlich gemacht, und jede andere unerwünschte verkürzte Schwankung in AP oder ML wird als Stabilitätsmerkmal betrachtet.Für den Sprachtest werden die Merkmale, die die rhythmische Natur der wiederholten / ta / -Äußerungen messen, beispielsweise die Lücke zwischen aufeinanderfolgenden / ta / -Äußerungen, die Dauer von a / ta / als Rhythmizitätsmerkmale und das Resonanzfrequenzmerkmal als Zeitmerkmal betrachtet. Ein niedrigeres Dämpfungsverhältnis zeigt eine höhere Schwingung an. Daher weist das niedrigere Dämpfungsverhältnis von a / ta / Äußerung als ataxisches akustisches Merkmal auf eine Instabilität des Stimmtrakts während der Stimmartikulation hin.

Eine Zusammenfassung der neun Tests in 5 Domänen, die 172 Merkmale erzeugen, ist mit ihrer Sterninterpretation in Tabelle 2 dargestellt.

Klinische Bewertung

CA wurde von einem erfahrenen Kliniker gemäß der SARA-Skala bewertet, während Probanden mit Ataxie jede Aufgabe ausführten. SARA ist eine klinische Skala, die von Schmitz-Hübsch et al.25,26, die eine Reihe verschiedener Beeinträchtigungen der Kleinhirnataxie bewertet, von der Sprache bis zum Gleichgewicht. Die Skala besteht aus 8 Kategorien mit Punktzahlen wie Gang (0-8 Punkte), Haltung (0-6 Punkte), Sitzen (0-4 Punkte), Sprachstörung (0-6 Punkte), Fingerjagd (0-4 Punkte), Nasenfingertest (0-4 Punkte), schnelle abwechselnde Handbewegung (0-4 Punkte), Fersenschienbeinrutsche (0-4 Punkte). Sobald der Kliniker jede der 8 Kategorien für eine Person bewertet, kann er die kumulative Punktzahl von 0 (keine Ataxie) bis 40 (schwerste Ataxie) weiter berechnen, um den Schweregrad der Ataxie des Ataxieteilnehmers zu bestimmen. In unserer Studie bewertete ein Kliniker alle Aufgaben, um subjektive Verzerrungen zu vermeiden.

3-stufiges Bewertungsschema des COA-Systems

Die Techniken, die in das vorgeschlagene instrumentierte System (COA-System) integriert werden sollen, werden anhand eines Flussdiagramms demonstriert (Abb. 3) und in den folgenden Unterabschnitten beschrieben.

Abbildung 3

3-tier Bewertung prozess flussdiagramm von COA System.

Merkmalsreduktion und statistische Analyse

Die ursprüngliche Merkmalsextraktion für jeden Test basierte auf relevanten früheren Studien4,6,7,8,9,10,11. Insgesamt wurden 172 Merkmale als kritisch für die objektive Beurteilung einzelner Tests identifiziert. Prozessmessungen enthalten viele korrelierte oder redundante Daten. Es ist wichtig, sie zu entfernen und die Funktionen zu extrahieren, die die größte unabhängige Relevanz haben. Principal Component Analysis (PCA)27 ist ein Datenkompressions-, Extraktions- und Visualisierungswerkzeug, mit dem mehrere assoziierte Faktoren in eine Gruppe unkorrelierter Variablen umgewandelt werden. PCA wird verwendet, um die ursprünglichen 172 Merkmale in 27 Stück (3 Stück aus jedem der 9 Tests) zu komprimieren (Abb. 3). Darüber hinaus stammen kritische Informationen nicht von einer einzelnen Variablen eines einzelnen Tests, sondern häufig aus der Beziehung zwischen Variablen, d. H. Wie sie sich gegenseitig variieren. PCA ist unter den häufig verwendeten multivariaten statistischen Methoden zur Auswertung solcher Informationen am besten geeignet, da sie eine große Anzahl stark korrelierter, verrauschter und redundanter Faktoren verwalten kann.

Der p-Wert für Hypothesentests wird für die Verteilungen der resultierenden 3 PCs (PCs 1-2-3) jedes Tests in Bezug auf jede der 5 Domänen (Sprache, obere Extremität, untere Extremität, Gang, Gleichgewicht) berechnet, um festzustellen, ob sich die Gruppen von Probanden (Kontrolle und Ataxie) signifikant unterscheiden. In jeder Domäne werden Personen mit SARA-Werten größer als Null als ataxisch gruppiert, und Kontrollen und Probanden, die für einen bestimmten Test einen SARA-Wert von 0 erzielt haben, werden als normal gruppiert. Nicht-parametrische statistische Tests (Kolmogorovâ €“Smirnov (KS) und Mann-Whitney-Wilcoxon (MWW)) werden angenommen Annahmen über die Datenverteilung zu vermeiden.

Graphentheorie & Zentralitätsmaße

Visuelle Quantifizierung der Test- /Domänenabhängigkeiten

Die Graphentheorie wird angewendet, um weitere Einblicke in die Beziehungen zwischen Tests und Domänen zu erhalten. Tests und Domänen wurden den Knoten eines Netzwerks zugewiesen, das die Knoten durch Kanten mit Längen verband, die Spearmans Rangkorrelationskoeffizienten (ρ) darstellten. Die Zentralität eines Knotens gibt die Anzahl der an diesen Knoten angrenzenden Kanten und die Nähe zu allen anderen Knoten an, was als Hinweis auf die Bedeutung des Knotens angesehen wird. Die Häufigkeit, mit der ein Knoten auf dem kürzesten Weg zwischen zwei anderen Knoten erscheint, ist ebenfalls ein wichtiges Maß. Die MST-Analyse (Minimum Spanning Tree) 28 wird in unserer Studie als zuverlässiges Maß für den Vergleich der Netzwerke über verschiedene Gruppen hinweg verwendet, da sie unvoreingenommen ist und keine willkürlichen Parametereinstellungen erfordert29. MST wurde erst kürzlich auf Gehirnnetzwerke angewendet29 und Identifizierung kritischer Gene bei Diabetes mellitus30. Der MST ist ein Unterdiagramm, das alle Knoten verbindet, um die Gesamtkantenlänge zu reduzieren. In diesem Sinne ist das MST das „Backbone“ -Netzwerk, das die Abhängigkeiten zwischen Test / Domäne kapselt. Um die Nähe zu messen, verwenden wir die folgende Abbildung, um die Rangkorrelationskoeffizienten von Spearman (ρ) in Entfernungen zu übersetzen.

$$f(\rho )=1-\rho ,$$
(1)

$$oder,f(\rho )=\sqrt{2(1-\rho )}.$$
(2)

MST dieses Graphen wird berechnet, indem die Tests /Domänen den Knoten eines Netzwerks zugewiesen und die Knoten über Kanten mit Längen verbunden werden, die durch ρ gegeben sind.

Überblick über die Test- /Domänenwichtigkeit mithilfe von Graph centrality measures

Die Darstellung der Tests und Domänen in Diagrammform ermöglicht die Quantifizierung der Beziehungen zwischen ihnen. Da mathematische Graphen Knotensignifikanzmessungen intrinsisch charakterisieren, werden die diesen Knoten zugewiesenen Tests / Domänen als hochrelevant für die Messung von CA angesehen. Feature Wichtigkeit Score wird dann auf dem gesamten Diagramm mit populären Zentralität Maßnahmen wie Grad Zentralität berechnet, Nähe Zentralität und Betweenness30. Die Inzidenz oder Gradzentralität eines Knotens in einem gegebenen Graphen zählt die Anzahl der Kanten, die an diesen Knoten angrenzen, der mathematisch definiert ist als,

$${C}_{D}(N)={\rm{\deg }}(N),$$
(3)

wobei g := (N, e) der gegebene Graph mit |N| Knoten und |e/ Kanten ist. In einem verbundenen Graphen wird die durchschnittliche Länge des kürzesten Pfades zwischen dem Knoten und allen anderen Knoten im Netzwerk als normalisierte Näherungszentralität (oder Nähe) eines Knotens bezeichnet. Daher impliziert ein hoher Wert der Nähe, dass der Knoten zentral oder signifikant ist. Die Nähe ist definiert als der Kehrwert der Summe der Abstände vom Knoten zu allen anderen Knoten, dh

$${C}_{C}({N}_{1})=\frac{1}{{\sum }_{y}d({N}_{2},{N}}_{1})},$$
(4)

wobei d(N1, N2) der Abstand zwischen den Eckpunkten N1 und N2 ist. Ebenso berechnet die Betweenness eines Knotens, wie häufig dieser Knoten zwischen zwei anderen Knoten im Diagramm auf dem kürzesten Pfad angezeigt wird. Ein hoher Wert von Betweenness bedeutet, dass der Knoten relevant ist. Die Betweenness eines Knotens N wird bezeichnet als,

$${C}_{B}(N\rangle =\sum _{{N}_{1}\ne N\ne {N}_{2}\in N}\,\frac{{\sigma }_{{N}_{1}{N}_{2}}(N\rangle }{{\sigma }_{{N}_{1}{N}_{2}}},$$
(5)

Klassifizierungsexperiment

Binäre Klassifikation

Der nächste Schritt des Schemas besteht aus einer Diagnose oder einem binären Klassifizierungsproblem, bei dem die Diskriminierungsleistung jedes einzelnen Tests, des kombinierten 9-Tests und zweier reduzierter Teilmengen unter Verwendung eines Random Forest (RF) -Klassifikators verglichen wird31. Jedes Merkmal trug in unterschiedlichem Maße zu jeder der 4 Holmesschen Dimensionen bei (die Gewichte), die entsprechend für den gesamten 9-Test sowie für die optimale Teilmenge von Tests berechnet wurden.

Multilabel-Klassifikation

In unserer Studie wird ein Random-Forest-basierter Klassifizierungsalgorithmus für die Multilabel-Klassifikation32 verwendet.

Der Feature-Input im Multilabel-Klassifikationsproblem unserer Studie bestand aus 27 Hauptkomponenten aus allen Tests (3 Stück x 9 Tests). Ziel war es, die Behinderungen in 5 Domänen (0: normal; 1: ataxisch) zu identifizieren. Beispielsweise, Ein Teilnehmer wird durch die Domänen Sprache dargestellt, obere Extremität, untere Extremität, Gang und Gleichgewicht; und die mögliche Darstellung des Label-Powersets ist ein Mehrklassenklassifizierungsproblem mit den Klassen , , , , , , , , …, wobei beispielsweise ein Teilnehmer bezeichnet wird, dessen Domänen Sprache und untere Extremität betroffen sind, während die Domänen obere Extremität, Gang und Gleichgewicht nicht betroffen sind.

Merkmalswichtigkeit (oder Rang) im RF-Modell

Gleich zu Beginn wird die optimale Blattgröße in einem RF-Klassifikator überprüft, indem mittlere quadratische Fehler (Mean Squared Errors, MSE) verglichen werden, die durch Klassifizierung für verschiedene Blattgrößen (5, 10, 20, 50 und 100) erhalten wurden. Die optimale Blattgröße sollte die niedrigsten MSE-Werte ergeben. Sobald wir die optimale Blattgröße geschätzt haben, wird ein größeres Ensemble gezüchtet und zur Schätzung der Merkmalsbedeutung verwendet. Um die Merkmalsbedeutung im Random Forest-Diagnosemodell zu berechnen, wird zunächst die MSE des Modells mit den ursprünglichen Variablen berechnet. Dann werden die Werte einer einzelnen Spalte (die das Merkmal 1 für n Beobachtungen darstellt) permutiert und die MSE wird erneut berechnet. Wenn beispielsweise eine Spalte die Merkmalswerte x1, x2, x3, x4 annimmt und eine zufällige Permutation der Werte zu x4, x3, x1, x2 führt, führt dies zu einer neuen MSE. Die Differenz der MSE wird über alle Bäume im Ensemble gemittelt und durch die Standardabweichung dividiert, die über die Bäume für jede Variable genommen wird. Je größer dieser Wert ist, desto signifikanter ist die Variable. Es wird erwartet, dass die Differenz positiv ist, aber wenn es sich um eine negative Zahl handelt, bedeutet dies, dass die zufällige Permutation besser funktioniert hat und dass das Merkmal keine Rolle in der Vorhersage spielt und nicht als wichtig erachtet wird.

Sternberechnung

Sobald die Wichtigkeit / der Rang der 3 PC-Features für einen bestimmten Test durch das Random Forest-Ranking-Schema bewertet wurde, wird das Gewicht des ursprünglichen Features wie folgt berechnet:

$$feature\_weights=WOF\_InPC{1}^{\ast }R\_PC1+WOF\_InPC{2}^{\ast }R\_PC2+WOF\_InPC{3}^{\ast }R\_PC3,$$
(6)

wobei WOF: Gewicht dieses Merkmals in einer PC-Komponente; R: Rang des funktion in RF modell. Da sich jedes Merkmal auf eine der 4 Holmesschen Dimensionen bezieht, ist der Beitrag der Gesamtstabilität, des Timings, der Genauigkeit und der Rhythmikdimension die akkumulierte Gewichtung aller Stabilitäts-, Timing-, Genauigkeits- und Rhythmikmerkmale.

Kreuzvalidierung (CV)

Für beide Klassifizierungsprobleme werden die Daten mit einer Leave-One-out (LOO) CV-Technik geschichtet. Die Kreuzvalidierung in Multilabeleinstellungen wird durch die Tatsache erschwert, dass der gewöhnliche (binäre / Mehrklassen-) Weg der geschichteten Stichprobe nicht anwendbar ist; alternative Wege der approximativen geschichteten Stichprobe wurden in33 vorgeschlagen. In unserer Studie wurde die Multi-Label-Stratifizierung mit einer iterativen Technik durchgeführt.

Bewertungsmetriken

Die Leistung des Klassifikators wird anhand der Metriken Präzision, Rückruf, F1-Score, Genauigkeit und Matthews-Korrelationskoeffizient (MCC)34 bewertet. Diese Metriken werden für jede Domäne basierend auf den vorhergesagten Werten nach jeder Validierung in LOO (34-mal) berechnet. Allgemeine Präzision, Rückruf, F1-Score, Genauigkeit des Multilabel-Klassifizierungsproblems sind der Durchschnitt der Ergebnisse durch LOO in den 5 Domänen. Beispiel:

$$general\_precision=sum(precision\_values\_in\_5\_domains)/5.$$
(7)

Feature-Ranking durch einen RF-Zug & Die Validierung mit LOO ist der Durchschnitt aller Ränge in jeder Trainings- und Validierungsphase sowohl für die Binär- als auch für die Multilabel-Klassifizierungsprobleme.