Articles

obiektywna ocena ataksji móżdżku: kompleksowe i dopracowane podejście

system kompleksowej oceny obiektywnej (Coa)

w tym badaniu wykorzystaliśmy biokin17, opartą na chmurze platformę do przechwytywania ruchu w czasie rzeczywistym, aby przeprowadzić kompleksową obiektywną ocenę OK. BioKin17 to bezprzewodowe urządzenie do noszenia z wbudowanym trójosiowym akcelerometrem (model chipsetu „MPU-9150” firmy InvenSense, Inc., San Jose, CA, USA) oraz IEEE802.11b/g/n / Bezprzewodowy interfejs komunikacyjny działający na 32-bitowym procesorze ARM. System Czujników BioKin opracowany przez Networked Sensing and Control Lab, Deakin University, może współdziałać z aplikacją mobilną Android do przechwytywania złożonych ruchów ludzkiego ciała w czasie rzeczywistym, jak pokazano na Fig. 1. Jest zoptymalizowany w celu zmniejszenia efektów osiadania i problemów z dryfem czujnika poprzez wyeliminowanie błędów osiowania na poziomie płyty między każdym czujnikiem inercjalnym17. Czujnik ten został oznaczony na podstawie konwencjonalnego optycznego systemu śledzenia ruchu opartego na wielu kamerach (System Vicon, T40S, Oxford, Wielka Brytania), systemu znakowania o wysokiej precyzji18. BioKin przechwycił dane żyroskopu i przyspieszenia w trójwymiarowych (3D) współrzędnych kartezjańskich z częstotliwością próbkowania 50 Hz. Ocenę CA przeprowadzono w następujących etapach:

  1. wejścia ruchu generowane przez dziewięć testów instrumentowanych, które naśladują dziewięć standardowych testów klinicznych przy łóżku ca obejmujących 5 domen.

  2. są one rejestrowane przez czujniki i wizualizowane za pomocą aplikacji wspomagającej w smartfonie.

  3. bezprzewodowa transmisja do sieci chmury rozproszonej opartej na łańcuchu blockchain19, w której stosowane są algorytmy diagnostyczne i oceniające.

  4. wyniki analizy danych są przekształcane w klinicznie istotny format.

na Rys. 1.

wprowadzanie ruchu

pacjenci zostali zmuszeni do wykonania dziewięciu standardowych badań klinicznych; powtarzana sylaba (SPE), rytmiczne stukanie palcami (FIN), palec-nos/nos-palec (FNT), dysdiadochokineza (DDK), śledzenie balistyczne/pościg palcem (BAL), pięta-goleń (HST), stukanie stopą (FOO), postawa/romberg (ROM) i chód (WAL). Zadania są wykonywane zgodnie z instrukcjami określonymi w SARA, które obejmują wszystkie 5 domen. Aby uniknąć wszelkich czynników zakłócających związanych z kołysaniem podczas wykonywania badań w pozycji siedzącej, uczestnicy otrzymali wsparcie osiowe, tj. siedzący wygodnie w pozycji pionowej. Podparcie oparcia krzesła było nachylone pod kątem 90-100 stopni z odpowiednim podparciem drewna zgodnie z dolną częścią pleców. Oceniano zarówno prawą, jak i lewą kończynę.

Akwizycja danych

System COA wykorzystał inercyjne jednostki pomiarowe (IMU) wyposażone w system BioKin w siedmiu testach do przechwytywania kinematyki translacyjnej i obrotowej w osiach ortogonalnych za pomocą akcelerometrów i żyroskopów. W jednym z testów wykorzystywano także kamerę Microsoft Kinect V2 wyposażoną w 23-calowy monitor oraz mini PC z procesorem Intel core i5 do przechwytywania ruchu na podstawie markera i uzyskiwania informacji o absolutnej pozycji.

algorytmy oparte na chmurze

zarejestrowane dane są następnie przesyłane do sieci chmury rozproszonej opartej na łańcuchu blockchain19 za pośrednictwem połączenia bezprzewodowego w celu późniejszego przetwarzania danych, umożliwiając lekarzom uzyskanie oceny ważności. Środowiska MATLAB (R2019a, MathWorks) i Python przetwarzały dane przesyłane drogą bezprzewodową.

wyniki kliniczne

przechwycone dane są wizualizowane za pomocą aplikacji na smartfony z systemem Android, BioKin, która generuje raporty oceny i oceny nasilenia w wyniku przetwarzania danych w chmurze.

w naszym systemie COA średni czasowy wydatek na pozyskanie danych za pomocą Motion capture z każdego z 6 testów peryferyjnych (DDK, FNT, FIN, BAL, FOO, HST) wynosi mniej niż 15 sekund. Test równowagi (ROM) zajmuje mniej niż 30 sekund; test chodu(WAL) zajmuje mniej niż 90 sekund, podczas gdy test mowy (SPE) zajmuje mniej niż 5 sekund, aby uzyskać dane. W związku z tym średni czasowy wydatek na pozyskanie danych i wygenerowanie skumulowanego wyniku testu (przy użyciu algorytmów opartych na chmurze) dla pojedynczego pacjenta wynosi odpowiednio około 215 sekund i 5 sekund. Zestaw testowy zwykle trwa do 30 sekund.

projekt eksperymentalny

uczestnicy

w celu dogłębnej analizy nieprawidłowości związanych z czasem, stabilnością, dokładnością i rytmicznością ruchów ruchowych, mowy i danych kinematycznych zarejestrowano 34 osoby, których językiem ojczystym był angielski. Dwadzieścia trzy wcześniej zdiagnozowano ataksję móżdżku (CA) z powodu zaburzenia neurodegeneracyjnego i uczęszczał do Kliniki Neurologii w Royal Victorian Eye and Ear Hospital (Rveeh) lub Alfred Hospital w Melbourne. Jedenastu zdrowych uczestników (osób z grupy kontrolnej) było ochotnikami bez żadnych schorzeń neurologicznych lub innych zaburzeń mowy w wywiadzie. Podsumowanie statystyk kohorty przedstawiono w tabeli 1. Żaden z uczestników (grupa kontrolna i CA) nie przeszedł żadnego programu rehabilitacji przed tym badaniem klinicznym. Żaden z uczestników (grupa kontrolna i CA) nie przeszedł żadnego programu rehabilitacji przed tym badaniem klinicznym. Przegląd literatury20, 21, 22 ujawnił, że wiek zachorowania, wiek diagnozy i inne czynniki demograficzne nie wpływają na wiek i GMO-związane z ataksją. Ponieważ nasze badanie ograniczało się do kohorty ataksji u dorosłych, ścisłe przestrzeganie kryteriów dopasowanych do wieku i płci nie było możliwe.

Tabela 1 Charakterystyka kliniczna włączonych uczestników.

zatwierdzenie Etyki i zgoda na udział

to badanie zostało zatwierdzone przez Komitet Badań i etyki człowieka, Royal Victorian Eye and Ear Hospital, East Melbourne, Australia (Numer referencyjny HREC: 11/994H/16) i wspierane przez Florey Institute of Neuroscience and Mental Health, Melbourne, Australia za pośrednictwem National Health and Medical Research Council (Nhmrc) dotacja: gnt1101304 i app1129595. Wszystkie metody w tym badaniu zostały przeprowadzone zgodnie z odpowiednimi wytycznymi i przepisami oraz uzyskano pisemną zgodę wszystkich uczestników przed ich zapisem. Obu badanych uzyskano świadomą zgodę na opublikowanie obrazów przedstawionych na Rys. 1.

Testing protocol and feature extraction

obiektywne oceny dziewięciu testów neurologicznych są zgrupowane w następujących 5 domenach z krótkim opisem ich protokołu wykonania. Podsumowanie cech, które okazały się kluczowe w diagnostyce CA w odnośnym badaniu4,6,7,8,9,10,11 został również uwzględniony dla każdej podsekcji badania w tabeli 2.

Tabela 2 Krótki opis charakterystyki gwiazdowej 172 cech uzyskanych z 9 badań neurologicznych.

mowa

  • powtarzanie sylaby (spe): kandydat musiał powtarzać sylabę spółgłoskowo-samogłoskową/ ta / przez 5 sekund z preferowaną prędkością. Nagrania zostały wykonane przy użyciu mikrofonu pojemnościowego przyczepionego w odległości około 10 cm od ust testera w cichym pomieszczeniu o niskim poziomie szumów otoczenia. Telefon z Androidem za pomocą programu BioKinMobi pod nadzorem profesjonalnego śledczego uchwycił przemówienie. Zautomatyzowany algorytm oparty na topograficznym wyeksponowaniu został zastosowany do wyodrębnienia sześciu cech akustycznych z ciągu powtarzanych/ta/ sylaby4,6.

  • regularność czasu trwania mierzy zmienność rytmu powtarzanej / ta / (RT) wypowiedzi. Jest to zidentyfikowane jako integralna miara deficytów czasowych wyodrębnionych z danych falowych przy 50% wyeksponowaniu.

  • regularność odstępów mierzy zmienność różnicy czasu między dwoma kolejnymi pikami / ta / sylabowymi.

  • średnie wyeksponowanie piku mierzono średnią względną wysokość/ pik dla danego / ta / impulsu.

  • regularność kompensacyjna mierzyła zmienność różnic obliczonych między pikiem a odpowiadającym mu znaczeniem dla określonego impulsu / ta / sylabicznego.

  • współczynnik tłumienia mierzył średnie współczynniki tłumienia / ta / sylaby obliczone na podstawie danych falowych pobranych w 75%.

  • częstotliwość rezonansowa mierzyła średnią częstotliwość rezonansową / ta / sylaby obliczoną na podstawie danych falowych pobranych w 50%.

kończyna górna

  • Test rytmicznego stukania palcami (FIN): uczestnicy rytmicznie stukali palcem wskazującym o poziomą powierzchnię (np. blat stołu) z preferowaną prędkością i czasem trwania. BioKin został zamontowany na grzbiecie wskazującego palca wskazującego w celu pozyskania danych. Wybrano trzy pierwsze główne składowe (PC) entropii wieloskalowej mierzonej z osi X i Z sygnałów akcelerometru i osi X sygnałów żyroskopu oraz współczynnik zmienności interwału międzyprzeglądowego mierzącego nieregularność rytmu7.

  • test palca-nosa (FNT): Uczestnicy musieli dotknąć nosa palcem wskazującym, a następnie, używając tego samego palca, wyciągnąć rękę i dotknąć palca klinicysty znajdującego się około 25 cm od nosa testera. Ruchy dłoni były mierzone za pomocą Biokina przymocowanego do grzbietu dłoni wskazującego palca wskazującego. Częstotliwość rezonansowa i amplituda przy częstotliwości rezonansowej były kluczowymi cechami8 uchwyconymi przez BioKin przymocowany do dłoni wskazującego palca wskazującego. Do wychwytywania rezonansu w każdej osi ortogonalnej (X, Y i Z)wykorzystano domenę częstotliwości przyspieszenia i prędkości kątowej 8.

  • Test Dysdiadochokinezy (DDK): uczestnicy musieli umieścić grzbiet jednej ręki na dłoni drugiej ręki, jak pokazano na Fig. 1. Następnie uczestnicy zostali poinstruowani, aby wyprostować rękę, tak aby strona dłoni była skierowana w dół, aby spocząć na dłoni drugiej ręki. Tester jest również poinstruowany, aby pronować i supinować naprzemiennie między tymi dwoma pozycjami tak szybko i precyzyjnie, jak to możliwe. Szybkość przemienności jest pobierana z IMU biokina przymocowanego do nadgarstka. Test ten badany pod kątem niemożności koordynacji ruchu. Szybkość zmian pronatu i supinatu, częstotliwość rezonansowa i amplituda przy częstotliwości rezonansowej były cechami krytycznymi8.

  • śledzenie balistyczne (BAL): uczestnicy musieli wskazać cel na ekranie monitora. Ruch wskazującego palca wskazującego został wykryty za pomocą kamery Kinect i został przedstawiony jako marker na ekranie. Celem jest dokładne śledzenie celu za pomocą rzutowanego (za pomocą kamery Kinect) znacznika na ekranie, gdy cel porusza się szybko i losowo z punktu do punktu na monitorze. Następujące wyodrębnione cechy wykazywały znaczący poziom korelacji z poziomem niepełnosprawności zarejestrowanym w standardowym badaniu klinicznym SARA9:

  • błąd: odległość między trajektoriami markera i celu, mierzona metodą dynamicznego wypaczenia czasu w osi poziomej(H) i pionowej(V).

  • : Obliczono to jako korelację krzyżową dla sekwencji dwóch czasów, markera i celu.

  • opóźnienie kinematyczne: uzyskano to za pomocą wskaźnika pomiaru wydajności w prawie Fittsa. Funkcja ta ma na celu pomiar wydajności obiektu w osiągnięciu pozycji docelowej.

  • zmiana kierunku w osi H I V: jest to liczba razy uczestnik zmieniał swoje przyspieszenie, które było mierzone pod względem zmiany kierunku. Funkcja ta zawierała informacje o nad / pod strzałem, a także o wydajności testera podczas testu. Wyższy poziom dysmetrii wywnioskował większy poziom błędu zgodnie z różnicą między trajektoriami celu i markera.

kończyna dolna

  • Test pięty-goleni (HST): uczestnicy musieli umieścić piętę na przeciwległym kolanie i biegać nią wzdłuż piszczeli, między piętą a kolanem powtarzalnie i tak dokładnie, jak to możliwe. Biokin był przymocowany do grzbietu stopy. Częstotliwość rezonansowa i amplituda przy częstotliwości rezonansowej były cechami krytycznymi 8.

  • : Uczestnicy byli zobowiązani do rytmicznego stukania każdą stopą o poziomą powierzchnię (np. podłogę). Wybrano 3 pierwsze główne składowe (PC) entropii wieloskalowej mierzonej z osi X i Z sygnałów akcelerometru i osi X sygnałów żyroskopu, a także współczynnik zmienności interwału międzyobrotowego mierzącego nieregularność rytmu7.

równowaga

  • test Romberga (ROM): uczestnicy musieli stać ze stopami razem, a następnie ze stopami osobno, ramiona po bokach tak długo, jak to możliwe (do 30 sekund); najpierw z otwartymi oczami, a potem z zamkniętymi oczami. Jeden BioKin został umieszczony w przybliżeniu na xiphisternum za pomocą elastycznego pasa neoprenowego. Drugi BioKin był przymocowany w górnej części pleców, w linii środkowej tuż poniżej szyi. Zastosowano technikę Fuzzy entropy na posturalnej prędkości kołysania wynikającej z zmierzonych przyspieszeń ściętych. Wartości entropii 23 wydedukowanej prędkości rozważano przede wszystkim jako miarę sterowania silnikiem nerwowym podczas cichej postawy stojącej, której znaczna część jest proporcjonalna do prędkości kołysania się ciała. Niepewność w pomiarze prędkości zawierała znaczny poziom informacji w odniesieniu do niestabilności obcięcia10.

chód

  • test chodu (WAL): uczestnicy musieli przejść 5 metrów i powrócić, co powtórzono 10 razy. Ruchy testera zostały uchwycone przez wbudowane czujniki inercyjne smartfona przymocowanego w xiphisternum za pomocą elastycznego neoprenowego paska i dwóch czujników BioKin, przymocowanych do każdej kostki. Czujnik został umieszczony w taki sposób, że jego osie X, Y i Z przechwytywały ruchy ML (Medio-Lateral), AP (Antero-Posterior) i Vt (Vertical Axis). W każdej osi ortogonalnej (X, Y I Z) do wychwytywania rezonansu użyto opisu dziedziny częstotliwości.11 Dla każdego obiektu, wielkość i rezonans zostały użyte w każdej osi, aby utworzyć wektor funkcji. W badaniu wybrano inną cechę, fuzzy Entropy-based velocity irregularity measure for truncal abormality (VI), aby zmierzyć przypadkowość chodu lub poziom niepewności podczas chodzenia. W badaniu in23 wprowadzono entropię rozmytą (FuzzyEn) w celu uchwycenia ataksji truncal.

w odniesieniu do kohorty ataksowej włączonej do naszego badania, dla osób z wynikiem SARA 7 za chodzenie – w przypadku, gdy wymagana jest pomoc chodu, pacjent jest proszony o wykonanie testu przy użyciu odpowiedniej pomocy chodu (tj. drążka jednopunktowego lub ramy Czterokołowej (4WF)).

Ataxic dimensions (STAR)

prace Gordona Holmesa są często cytowane jako mające fundamentalny wpływ na nasze zrozumienie klinicznych objawów i oznak zmian móżdżku2,3,24. W naszych badaniach ponownie przyjrzeliśmy się podejściu Holmesa do scharakteryzowania ruchu podmiotu z dysfunkcją móżdżku w czterech wymiarach (stabilność, czas, dokładność & rytmiczność).

  • stabilność (S): odnosi się do stabilności w platformie (wykonania). Platforma to stawy i mięśnie, które są stosunkowo nieruchome i umożliwiają ruchome części ciała dokładne wykonanie zadania. Na przykład zadanie DDK wymaga względnej stabilności zgięcia i wyprostu barku i łokcia w celu skutecznego wykonania. Względna niestabilność powoduje wzrost niepotrzebnych ruchów w osiach drugorzędnych.

  • Timing (T): gdy występuje CA, zadania, które mają ograniczenia czasowe, takie jak BAL, zwykle mają zwiększone opóźnienie przed rozpoczęciem ruchu i zadanie jest wykonywane z mniejszą prędkością, ponieważ Kurs jest mniej bezpośredni. Te same cechy są często widoczne nawet w przypadku braku ograniczeń czasowych. Te cechy są bardziej widoczne, gdy CA jest bardziej dotkliwe, co sugeruje, że podświadomie, czas jest neutralny kompromis do wykonania zadania. Pod względem obliczeniowym uznaliśmy to za błąd między celem a tym, co zostało osiągnięte, na co mogą mieć wpływ następujące dwa:

  • Czas na zainicjowanie przez obiekt chwili.

  • Czas na ukończenie ruchu (prędkości).

    • dokładność (a): koncepcyjnie zadanie może być wykonywane powoli, ale podążać za najskuteczniejszym celem. W tych okolicznościach uznamy to za” dokładne ” wykonanie. Gdy następuje mniej bezpośrednia ścieżka (na przykład w zadaniu BAL) lub jest pod lub nad strzałem, zadanie będzie „błędy” w porównaniu z wydajnością sterowania (uznając, że może to być również związane z błędami czasowymi). Pod względem obliczeniowym, w tym badaniu uznajemy go za błąd między celami / przestrzenią a tym, co osiąga się w kontekście przestrzennym (statycznym).

    • rytmiczność (R): nieregularność w powtarzanych ruchach.

funkcje dla każdego testu w naszym proponowanym systemie COA są przypisane do wyżej wymienionych wymiarów za pomocą następującego dwuetapowego podejścia:

  1. (a) oś wykonania jest kierunkiem pierwotnego ruchu wymaganego do wykonania zamierzonego zadania i przypisywałaby wymiarowi rytmiczności lub czasu.

    (b) każde odchylenie od najbardziej wydajnej lub standardowej ścieżki wymaganej do wykonania zadania będzie uważane za cechy dokładności.

  2. nadmierne ruchy w innych osiach byłyby uważane za ruchy wtórne i przypisywane wymiarowi stateczności.

obrazkowa reprezentacja na Rys. 2 ilustruje interpretację Gwiazdy dla każdej domeny, zgodnie z proponowanym podejściem dwuetapowym.

Rysunek 2

kryteria oznakowania gwiazd.

w testach powtarzalnych (DDK, FNT, FIN, FOO, HST) częstotliwość rezonansowa wzdłuż osi y (Podstawowej) przyczynia się do prędkości, a zatem jest uważana za cechę pomiaru czasu, podczas gdy wielkość rezonansu jest uważana za cechę rytmiczną. Wtórne ruchy / zakłócenia obecne w innych osiach są określane jako cechy stateczności.

w przypadku testów opartych na celu (Bal), każde opóźnienie w podstawowym ruchu pościgu za celem jest uważane za funkcję pomiaru czasu; jak dobrze cel jest osiągnięty lub jakikolwiek stopień odchylenia w osiągnięciu celu określa wydajność uczestnika, a tym samym mierzy dokładność; wszelkie inne cechy związane z nadmiernymi/nieefektywnymi ruchami są oznaczone w stateczności.

test chodu polega na chodzeniu do przodu po linii prostej (wzdłuż osi AP) w regularnym tempie, podnosząc i ustawiając każdą stopę w rytmiczny sposób. Mogłoby to wywnioskować informacje o rytmiczności, podczas gdy zakres kołysania ściętego od osi AP (to jest ruch w osi ML) wywnioskuje informacje o dokładności. Co więcej, wszelkie niepożądane kołysanie w osi VT jest uważane za cechę stabilności.

w przypadku testu równowagi oczekuje się, że uczestnik utrzyma stałą prostą postawę wzdłuż osi VT. To jest ich główny ruch, każde odchylenie lub kołysanie w osi VT będzie odpowiadać za niedokładność, a wszelkie inne niepożądane kołysanie ścięte w AP lub ML są uważane za cechy stabilności.

w przypadku testu mowy cechy mierzące rytmiczny charakter powtarzanych/ ta /wypowiedzi, na przykład odstęp między kolejnymi/ ta /wypowiedziami, czas trwania a/ ta / są uważane za cechy rytmiczności, a funkcja częstotliwości rezonansowej za funkcję czasu. Niższy współczynnik tłumienia wskazuje na wyższą oscylację. Stąd niższy współczynnik tłumienia a/ ta / wypowiedzi, jako ataksjalna cecha akustyczna, wskazuje na niestabilność układu głosowego podczas artykulacji głosu.

w tabeli 2 przedstawiono podsumowanie dziewięciu testów w 5 domenach, generujących 172 cechy wraz z ich interpretacją gwiazdową.

ocena kliniczna

CA została oceniona przez doświadczonego klinicystę zgodnie ze skalą SARA, podczas gdy osoby z ataksją wykonywały każde zadanie. SARA jest skalą kliniczną opracowaną przez Schmitz-Hübsch et al.25,26, który ocenia zakres różnych zaburzeń w ataksji móżdżku, od mowy do równowagi. Skala składa się z 8 kategorii z wynikami w zakresie: chód (0-8 punktów), postawa (0-6 punktów), siedzenie (0-4 punktów), zaburzenia mowy (0-6 punktów), pościg palcem (0-4 punktów), test nos-palec (0-4 punktów), szybki naprzemienny ruch dłoni (0-4 punktów), ślizg pięty-goleni (0-4 punktów). Gdy klinicysta oceni każdą z 8 kategorii dla danej osoby, może dalej obliczyć skumulowany wynik w zakresie od 0 (Brak ataksji) do 40 (najcięższa ataksja) w celu określenia ciężkości ataksji osoby ataksującej. W naszym badaniu, aby uniknąć subiektywnych uprzedzeń, jeden klinicysta ocenił wszystkie zadania.

3-warstwowy schemat oceny systemu COA

techniki, które mają być włączone do proponowanego systemu oprzyrządowania (system CoA) są demonstrowane za pomocą schematu blokowego (rys. 3) i przedstawione w poniższych podrozdziałach.

Rysunek 3

3-warstwowy schemat procesu oceny systemu COA.

redukcja cech i analiza statystyczna

oryginalne wyodrębnienie cech dla każdego testu oparto na odpowiednich wcześniejszych badaniach4,6,7,8,9,10,11. Łącznie zidentyfikowano 172 cechy kluczowe dla obiektywnej oceny poszczególnych testów. Pomiary procesu zawierają wiele skorelowanych lub nadmiarowych danych. Ważne jest, aby je usunąć i wyodrębnić funkcje, które mają najbardziej niezależne znaczenie. Główna Analiza składowa (PCA) 27 to narzędzie do kompresji, ekstrakcji i wizualizacji danych używane do przekształcania kilku powiązanych czynników w grupę nieskorelowanych zmiennych. PCA służy do kompresji oryginalnych 172 funkcji na 27 sztuk (3 sztuki z każdego z 9 testów) (rys. 3). Co więcej, krytyczne informacje nie pochodzą z pojedynczej zmiennej pojedynczego testu, ale często wynikają z relacji między zmiennymi, tj. z tego, jak się wzajemnie różnią. PCA jest najbardziej odpowiednim spośród powszechnie stosowanych wielowymiarowych metod statystycznych do oceny takich informacji, ponieważ może zarządzać dużą liczbą wysoce skorelowanych, hałaśliwych i zbędnych czynników.

wartość p dla badania hipotezy jest obliczana dla rozkładu 3 PCs (PCs 1-2-3) każdego testu w odniesieniu do każdej z 5 domen (mowa, kończyna górna, kończyna dolna, chód, równowaga) w celu określenia, czy grupy badanych (kontrola i ataksja) różnią się znacząco. W każdej dziedzinie, osoby z SARA mierzą więcej niż zero, są grupowane jako ataksyczne, a kontrolni i testerzy, którzy uzyskali wynik SARA równy 0 dla danego testu, są grupowani jako normalni. Nieparametryczne testy statystyczne (Kolmogorov—Smirnov (KS) i Mann-Whitney-Wilcoxon (MWW)) są przyjmowane w celu uniknięcia założeń dotyczących dystrybucji danych.

teoria grafów& miary centralności

wizualne kwantyfikacje zależności testu/domeny

teoria grafów jest stosowana w celu uzyskania dalszych wglądów w relacje między testami i domenami. Testy i domeny zostały przypisane do węzłów sieci, które połączyły węzły krawędziami o długościach reprezentujących współczynniki korelacji rang Spearmana (ρ). Centralność węzła wskazuje liczbę krawędzi przylegających do tego węzła i bliskość wszystkich innych węzłów, co jest uważane za wskazanie znaczenia węzła. Częstotliwość pojawiania się węzła na najkrótszej ścieżce między dwoma innymi węzłami jest również miarą znaczenia. Analiza minimalnego drzewa rozprzestrzenienia (MST) 28 jest wykorzystywana w naszym badaniu jako wiarygodny środek porównywania sieci między różnymi grupami, ponieważ jest bezstronna i nie wymaga arbitralnego ustawiania parametru29. MST został niedawno zastosowany do sieci mózgowych29 i identyfikacji kluczowych genów w cukrzycy30. MST jest podgrafem, który łączy wszystkie węzły w celu zmniejszenia całkowitej długości krawędzi. W tym sensie MST jest „szkieletową” siecią, która zawiera zależności między testami/domeną. Aby zmierzyć bliskość, używamy następującego mapowania, aby przetłumaczyć współczynniki korelacji rang Spearmana (ρ) NA odległości.

$$f(\rho )=1-\Rho, $$
(1)

$$or,f(\Rho )=\sqrt{2(1-\Rho )}.$$
(2)

MST tego wykresu jest obliczane przez przypisanie testów/domen węzłom sieci i połączenie węzłów poprzez krawędzie o długościach podanych przez ρ.

przegląd znaczenia testu/domeny za pomocą miar centralizacji grafów

reprezentowanie testów i domen w formie grafu umożliwia kwantyfikację relacji między nimi. Ponieważ wykresy matematyczne wewnętrznie charakteryzują pomiary znaczenia węzłów, testy / domeny przypisane tym węzłom są uważane za bardzo istotne w pomiarach OK. Punktacja znaczenia funkcji jest następnie obliczana na całym wykresie za pomocą popularnych miar centralizacji, takich jak Centrality stopnia, Centrality bliskości i Betweenness30. Zapadalność lub stopień centralizacji węzła na danym wykresie liczy liczbę krawędzi przylegających do tego węzła, która jest matematycznie zdefiniowana jako,

$${C}_{D}(n)={\rm{\deg }}(n),$$
(3)

gdzie, G := (N, e) jest podanym wykresem z |N| węzłami i |e| krawędziami. Na połączonym wykresie średnia długość najkrótszej ścieżki między węzłem a wszystkimi innymi węzłami w sieci jest oznaczana jako znormalizowana bliskość (lub bliskość) węzła. Dlatego wysoka wartość bliskości oznacza, że węzeł jest centralny lub znaczący. Bliskość jest zdefiniowana jako odwrotność sumy odległości od węzła do wszystkich innych węzłów, to znaczy

$${C}_{C}({N}_{1})=\frac{1} {{\sum} _ {y}d ({n}_{2}, {N}_{1})},$$
(4)

gdzie D(N1, N2) to odległość między wierzchołkami N1 i N2. Podobnie, między węzłami oblicza, jak często węzeł pojawia się między dwoma innymi węzłami na wykresie na najkrótszej ścieżce. Wysoka wartość międzygatunkowa oznacza, że węzeł jest istotny. Między węzłem N jest oznaczona jako,

$${C}_{B}(N\rangle =\sum _{{N}_{1}\ne n\ne {N}_{2}\in n}\,\frac{{\sigma} _{N}_{1} {N}_{2}}(N\rangle} {{\sigma} _{N}_{1} {N}_{2}}},$$
(5)

eksperyment klasyfikacyjny

Klasyfikacja binarna

następny etap schematu składa się z diagnozy lub problemu klasyfikacji binarnej porównującego skuteczność dyskryminacji każdego z poszczególnych testów, połączonego testu 9 i dwóch zredukowanych podzbiorów przy użyciu Random Forest (RF) classifier31. Każda cecha przyczyniła się do każdego z 4 wymiarów Holmeshian w różnym stopniu (wagi), które zostały obliczone odpowiednio dla ogólnego testu 9, a także dla optymalnego podzbioru testów.

klasyfikacja Multilabelowa

w naszym badaniu zastosowano algorytm klasyfikacji Multilabelowej oparty na losowym lesie.

wkład funkcji w problem klasyfikacji multilabelowej naszego badania składał się z 27 głównych komponentów ze wszystkich testów (3 szt.x 9 testów). Celem było zidentyfikowanie niepełnosprawności w 5 domenach (0: normal; 1: ataxic). Na przykład uczestnik jest reprezentowany przez domeny mowy, kończyny górnej, kończyny dolnej, chodu i równowagi; a możliwa reprezentacja mocy etykiety jest wielopoklasowym problemem klasyfikacji z klasami , , , , , , , , …, gdzie, na przykład, oznacza uczestnika, którego domeny mowy i kończyny dolnej są dotknięte, podczas gdy domeny kończyny górnej, chodu i równowagi są nienaruszone.

znaczenie funkcji (lub ranga) w modelu RF

na samym początku optymalna wielkość liści w klasyfikatorze RF jest weryfikowana przez porównanie średnich błędów kwadratowych (MSE) uzyskanych przez klasyfikację dla różnych rozmiarów liści (5, 10, 20, 50 i 100). Optymalna wielkość liści powinna dawać najniższe wartości MSE. Po oszacowaniu optymalnej wielkości liści uprawia się większy zespół i wykorzystuje się go do oszacowania znaczenia cech. Aby obliczyć znaczenie funkcji w modelu diagnostycznym losowego lasu, początkowo oblicza się MSE modelu ze zmiennymi pierwotnymi. Następnie wartości pojedynczej kolumny (reprezentującej funkcję 1 dla N obserwacji) są permutowane, a MSE jest obliczane ponownie. Na przykład, jeśli kolumna przyjmuje wartości funkcji x1, x2, x3, x4 i losowa permutacja wartości powoduje x4, x3, x1, x2; to spowoduje to nowy MSE. Różnica w MSE jest uśredniana dla wszystkich drzew w zespole i podzielona przez odchylenie standardowe Przejęte dla drzew dla każdej zmiennej. Im większa jest ta wartość,tym bardziej znacząca jest zmienna. Oczekuje się, że różnica jest dodatnia, ale jeśli jest to liczba ujemna, oznacza to, że losowa permutacja działała lepiej, wnioskując, że cecha nie ma roli w przewidywaniu i nie jest uważana za ważną.

obliczanie gwiazd

gdy znaczenie / ranga 3 funkcji PC zostanie oceniona dla konkretnego testu za pomocą Losowego schematu rankingu Leśnego, waga oryginalnej funkcji jest obliczana w następujący sposób:

$$feature\_weights=WOF\_INPC{1}^{\AST }R\_PC1+WOF\_INPC{2}^{\AST }R\_PC2+WOF\_INPC{3}^{\AST }R\_PC3,$$
(6)

gdzie WOF: Waga tej funkcji w komponencie PC; R: Ranga funkcji komputera w modelu RF. Ponieważ każda cecha odnosi się do jednego z 4 wymiarów Holmeshiana, wkład ogólnego wymiaru stabilności, timingu, dokładności i rytmiczności jest skumulowanym weigtage wszystkich cech stabilności, timingu, dokładności i rytmiczności odpowiednio.

weryfikacja Krzyżowa (CV)

w przypadku obu problemów klasyfikacyjnych dane są stratyfikowane przy użyciu techniki Leave-one-out (LOO) CV. Weryfikacja krzyżowa w Ustawieniach multilabel jest skomplikowana przez fakt, że zwykły (binarny/wieloklasowy) sposób warstwowego pobierania próbek nie ma zastosowania; alternatywne sposoby przybliżonego warstwowego pobierania próbek zostały zasugerowane33. Tak więc, w naszym badaniu, wielowarstwowa stratyfikacja została przeprowadzona przy użyciu techniki iteracyjnej.

metryki ewaluacyjne

wydajność klasyfikatora oceniana jest za pomocą metryki, precyzji, przypomnienia, wyniku F1, dokładności i współczynnika korelacji Matthewsa (MCC)34. Te wskaźniki są obliczane dla każdej domeny na podstawie przewidywanych wartości po każdej walidacji w LOO (34 razy). Ogólna precyzja, przypomnienie, wynik F1, dokładność klasyfikacji multilabelowej to średnia wyników z LOO w 5 domenach. Na przykład

$$general\_precision=sum(precision\_values\_in\_5\_domains) / 5.$$
(7)

ranking funkcji za pomocą pociągu RF & Walidacja za pomocą LOO to średnia wszystkich rang w każdej fazie szkolenia i walidacji, zarówno dla problemów z klasyfikacją binarną, jak i multilabelową.