Articles

evaluarea obiectivă a ataxiei cerebeloase: o abordare cuprinzătoare și rafinată

sistem de evaluare obiectivă cuprinzătoare (COA)

În acest studiu, am folosit BioKin17, o platformă de senzori de captare a mișcării în timp real bazată pe cloud pentru a efectua o evaluare obiectivă cuprinzătoare a CA. BioKin17 este un dispozitiv portabil fără fir cu un accelerometru tri-axial încorporat (chipset Model „MPU-9150” de la InvenSense, Inc., San Jose, CA, SUA) și un IEEE802.11b / g / n / interfață de comunicare fără fir care rulează pe un procesor ARM pe 32 de biți. Sistemul de senzori BioKin dezvoltat de Networked Sensing and Control Lab, Universitatea Deakin, poate interacționa cu o aplicație mobilă Android pentru a capta mișcări complexe ale unui corp uman în timp real, așa cum este ilustrat în Fig. 1. Este optimizat pentru a reduce efectele de decantare și problemele legate de deriva senzorilor prin eliminarea erorilor de aliniere a axei transversale la nivel de placă între fiecare senzor inerțial17. Acest senzor a fost marcat pe bancă împotriva unui sistem convențional de urmărire a mișcării optice bazate pe mai multe camere (Vicon system, T40s, Oxford, Marea Britanie), un sistem de marcare a bancului de înaltă precizie18. BioKin a capturat datele giroscopului și accelerației în coordonatele carteziene tridimensionale (3D) la o rată de eșantionare de 50 Hz. Evaluarea CA a fost realizată prin următoarele etape:

  1. intrări de mișcare generate de nouă teste instrumentate care imită cele nouă teste clinice standard ale CA care acoperă cele 5 domenii.

  2. acestea sunt capturate de senzori și vizualizate cu o aplicație de sprijin într-un smartphone.

  3. transmisie Wireless către o rețea cloud distribuită bazată pe blockchain 19 unde se aplică algoritmi de diagnosticare și evaluare.

  4. rezultatele analizei datelor sunt transformate într-un format relevant din punct de vedere clinic.

o reprezentare picturală a platformei senzorului este ilustrată în Fig. 1.

Motion input

subiecții au fost făcuți să efectueze nouă teste clinice standard; rostirea repetată a silabelor( SPE), atingerea ritmică a degetelor (FIN), degetul-nas/nas-deget (FNT), disdiadochokinezie (DDK), urmărirea balistică/urmărirea degetelor (BAL), călcâiul (HST), atingerea piciorului (FOO), poziția/romberg (ROM) și mersul (WAL). Sarcinile sunt efectuate în linie cu instrucțiunile specificate în SARA care acoperă toate cele 5 domenii. Pentru a evita orice factori de confuzie din cauza legănării în timpul efectuării testelor în poziția așezată, participanților li s-a oferit suport axial, adică așezat confortabil într-o poziție verticală așezată. Suportul spătarului scaunului a fost înclinat la 90-100 de grade, cu suport adecvat pentru cherestea, în conformitate cu partea inferioară a spatelui. Au fost evaluate atât membrele drepte, cât și cele stângi.

achiziție de date

sistemul COA a utilizat unități de măsură inerțiale (IMU) echipate în sistemul BioKin în șapte dintre teste pentru a capta cinematica translațională și rotațională în axe ortogonale prin accelerometre și giroscoape. O cameră Microsoft Kinect V2 echipată cu un monitor de 23 inch și mini PC cu un procesor Intel core i5 a fost, de asemenea, utilizată într-unul dintre testele pentru captarea mișcării bazate pe marker și pentru a obține informațiile de poziție absolută.

algoritmi bazați pe Cloud

datele înregistrate sunt apoi transferate în rețeaua cloud distribuită bazată pe blockchain 19 prin conexiunea wireless pentru prelucrarea ulterioară a datelor, permițând medicilor să obțină scoruri de severitate. Mediile MATLAB (R2019a, MathWorks) și Python au procesat datele transmise prin mijloace wireless.

ieșire clinică

datele capturate sunt vizualizate prin aplicația de telefon inteligent bazată pe android, BioKin care generează rapoarte de evaluare și scoruri de severitate ca urmare a procesării datelor bazate pe cloud.

în sistemul nostru COA, cheltuielile temporale medii pentru obținerea datelor prin captarea mișcării de la fiecare dintre cele 6 teste periferice (DDK, FNT, FIN, BAL, FOO, HST) sunt mai mici de 15 secunde. Testul de echilibru(ROM) durează mai puțin de 30 de secunde; testul de mers (WAL) durează mai puțin de 90 de secunde, în timp ce testul de vorbire (SPE) durează mai puțin de 5 secunde pentru a obține date. Prin urmare, cheltuielile temporale medii pentru a obține date și a genera un rezultat Cumulativ al testului (folosind algoritmi bazați pe cloud) pentru un singur pacient sunt de aproximativ 215 secunde și, respectiv, 5 secunde. Setul de testare durează de obicei până la 30 de secunde.

design Experimental

participanți

pentru o analiză aprofundată a anomaliilor atribuite sincronizării, stabilității, acurateței și ritmicității mișcărilor motorii, datele de vorbire și cinematice au fost înregistrate de la 34 de subiecți a căror limbă maternă a fost engleza. Douăzeci și trei au fost diagnosticați anterior cu o ataxie cerebeloasă (CA) din cauza unei tulburări neurodegenerative și au participat la Clinica de Neurologie de la Royal Victorian eye and Ear Hospital (RVEEH) sau Spitalul Alfred din Melbourne. Unsprezece subiecți normali (controale) au fost voluntari fără antecedente de afecțiuni neurologice sau alte tulburări de vorbire. Rezumatul statisticilor de cohortă este prezentat în tabelul 1. Niciunul dintre participanți (controale și CA) nu a fost supus vreunui program de reabilitare înainte de această investigație clinică. Niciunul dintre participanți (controale și CA) nu a fost supus vreunui program de reabilitare înainte de această investigație clinică. O revizuire a literaturii20, 21, 22 a arătat că vârsta de debut, vârsta diagnosticului și alți factori demografici nu influențează vârsta și OMG-ul-legate de ataxie. Deoarece studiul nostru a fost limitat la o cohortă de ataxie cu debut la adulți, respectarea strictă a criteriilor de vârstă și sex nu a fost fezabilă.

Tabelul 1 caracterizarea clinică a participanților înrolați.

aprobarea eticii și consimțământul de a participa

acest studiu a fost aprobat de Comitetul de cercetare și etică umană, Royal Victorian eye and Ear Hospital, East Melbourne, Australia (Numărul de referință HREC: 11/994H/16) și susținut de Institutul Florey de Neuroștiințe și sănătate mintală, Melbourne, Australia, prin intermediul gnt1101304 și app1129595. Toate metodele din acest studiu au fost efectuate în conformitate cu orientările și reglementările relevante și a fost obținut consimțământul scris de la toți participanții înainte de înscrierea lor. Consimțământul informat a fost obținut de la ambii subiecți pentru a publica imaginile descrise în Fig. 1.

protocolul de testare și extragerea caracteristicilor

evaluările obiective ale celor nouă teste neurologice sunt grupate în următoarele 5 domenii cu o scurtă descriere a protocolului lor de execuție. Un rezumat al caracteristicilor care s-au dovedit esențiale în diagnosticul CA în studiul respectiv aferent4,6,7,8,9,10,11 a fost, de asemenea, inclus pentru fiecare subsecțiune de testare în tabelul 2.

Tabelul 2 scurtă descriere a caracterizării stelare a celor 172 de caracteristici extrase din cele 9 teste neurologice.

vorbire

  • enunț silabă repetată (SPE): candidatului i s-a cerut să repete silaba consoană-vocală/ ta / timp de 5 secunde la viteza preferată. Înregistrările au fost realizate cu ajutorul unui microfon condensator decupat la o distanță aproximativă de 10 cm de gura subiectului într-o cameră liniștită, cu un nivel scăzut de zgomot ambiental. Un telefon android care utilizează programul BioKinMobi sub supravegherea unui investigator profesionist a surprins discursul. Un algoritm automat bazat pe proeminență topografică a fost folosit pentru a extrage șase caracteristici acustice din trenul rostirilor repetate/ta/ silabă4,6.

  • regularitatea duratei măsoară variabilitatea ritmului rostirii repetate/ ta / (RT). Aceasta este identificată ca o măsură integrală a deficitelor de sincronizare extrase din datele valurilor la o proeminență de 50%.

  • regularitatea decalajului măsoară variabilitatea diferenței de timp între două vârfuri consecutive/ ta / silabă.

  • proeminența medie a vârfului a măsurat înălțimea/vârful relativ mediu pentru un anumit/ ta / impuls luat în considerare.

  • regularitatea compensării a măsurat variabilitatea diferențelor calculate între vârf și proeminența corespunzătoare pentru un impuls specific/ta / silabic.

  • raportul de amortizare a măsurat media raporturilor de amortizare a/ ta / silabelor calculate din datele de undă extrase la o proeminență de 75%.

  • frecvența rezonantă a măsurat media frecvenței rezonante a/ ta / silabelor calculată pe datele de undă extrase la o proeminență de 50%.

membrul superior

  • Test ritmic de atingere a degetelor (FIN): participanții și-au lovit ritmic degetul arătător pe o suprafață orizontală (de exemplu, blatul mesei) la viteza și durata preferate. Un BioKin a fost montat pe dorsumul degetului arătător pentru achiziția de date. Primele 3 componente principale (PC) ale entropiei multiscale măsurate din axele X și Z ale semnalelor accelerometrului și axa X a semnalelor giroscopului și coeficientul de variație al intervalului inter-tap care măsoară neregularitatea ritmului au fost caracteristicile selectate7.

  • Test deget-nas (FNT): Participanții au fost obligați să-și atingă nasul cu degetul arătător ascuțit și apoi, folosind același deget, să ajungă și să atingă degetul clinicianului plasat la aproximativ 25 cm de nasul subiectului. Mișcările mâinilor au fost măsurate de un BioKin atașat la dorsul mâinii degetului arătător. Frecvența de rezonanță și amplitudinea la frecvența de rezonanță au fost caracteristicile critice8 capturate de BioKin atașat la palma degetului arătător. Descrierea domeniului de frecvență a accelerației și a vitezei unghiulare a fost utilizată pentru a capta rezonanța în fiecare axă ortogonală (X, Y și Z)8.

  • testul de Disdiadochokinezie (DDK): participanților li s-a cerut să plaseze dorsumul unei mâini pe palma celeilalte mâini, așa cum este descris în Fig. 1. Participanții au fost apoi instruiți să-și pronunțe mâna, astfel încât partea palmei să fie orientată în jos pentru a se odihni pe palma celeilalte mâini. Subiectul este, de asemenea, instruit să pronate și să supină alternativ între aceste două poziții cât mai rapid și precis posibil. Rata de alternanță este extrasă din IMU-ul BioKin atașat la încheietura mâinii. Acest test a examinat incapacitatea de a coordona mișcarea. Rata de alterare a pronatului și supinatului, frecvența de rezonanță și amplitudinea la frecvența de rezonanță au fost caracteristicile critice8.

  • urmărirea balistică (BAL): participanților li s-a cerut să indice ținta pe un ecran de monitor. Mișcarea degetului arătător a fost detectată folosind camera Kinect și a fost prezentată ca un marker pe ecran. Obiectivul este de a urmări cu exactitate ținta prin intermediul marcatorului proiectat (cu camera Kinect) de pe ecran atunci când ținta se mișcă rapid și aleatoriu de la un punct la altul de pe monitor. Următoarele caracteristici extrase au prezentat un nivel semnificativ de corelație cu nivelul de dizabilitate capturat de măsura clinică standard SARA9:

  • eroare: distanța dintre traiectoriile marker și țintă, măsurată folosind metoda de deformare dinamică a timpului în axa orizontală(H) și verticală(V).

  • întârziere completă: Aceasta a fost calculată ca corelație încrucișată pentru secvența, markerul și ținta de două ori.

  • întârziere cinematică: aceasta a fost obținută folosind indicele de măsurare a performanței din Legea Fitts. Caracteristica este de a măsura performanța subiectului în atingerea unei poziții țintă.

  • schimbare direcțională în axa H și v: acesta este numărul de ori în care participantul și-a modificat accelerația, care a fost măsurată în termeni de schimbare direcțională. Această caracteristică conținea informații despre supra / sub-fotografiere, precum și performanța subiectului în timpul testului. Nivelul mai ridicat al dismetriei a determinat o rată de eroare mai mare în funcție de diferența dintre traiectoriile țintă și marker.

membrele inferioare

  • testul călcâiului-tibiei (HST): participanților li s-a cerut să plaseze un călcâi pe genunchiul opus și să-l alerge de-a lungul tibiei, între călcâi și genunchi în mod repetat și cât mai exact posibil. BioKin a fost atașat la dorsul piciorului. Frecvența de rezonanță și amplitudinea la frecvența de rezonanță au fost caracteristicile critice8.

  • ritmic picior transvazare (FOO): Participanții au fost obligați să atingă ritmic fiecare picior pe o suprafață orizontală (de exemplu, podea). Primele 3 componente principale (PC) ale entropiei multiscale măsurate din axele X și Z ale semnalelor accelerometrului și axa X a semnalelor giroscopului și coeficientul de variație al intervalului inter-tap care măsoară neregularitatea ritmului au fost caracteristicile selectate7.

echilibru

  • testul Romberg (ROM): participanților li s-a cerut să stea cu picioarele împreună, apoi cu picioarele depărtate, cu brațele pe laturi cât mai mult timp posibil (până la 30 de secunde); mai întâi cu ochii deschiși și apoi cu ochii închiși. Un BioKin a fost poziționat aproximativ pe xiphisternum cu ajutorul unei centuri elastice de neopren. Al doilea BioKin a fost atașat pe locația superioară a spatelui, în linia mediană chiar sub gât. Tehnica de entropie Fuzzy a fost utilizată pe viteza de balansare posturală dedusă din accelerațiile trunchiale măsurate. Valorile entropiei23 ale vitezei deduse a fost considerată în primul rând ca o măsură a controlului motorului neuronal în timpul unei poziții liniștite în picioare, din care o porțiune semnificativă este proporțională cu viteza de balansare a corpului. Incertitudinea în măsurarea vitezei conținea un nivel semnificativ de informații în ceea ce privește instabilitatea trunchiului10.

mers

  • test de mers (WAL): participanților li s-a cerut să meargă 5 metri și să se întoarcă, care a fost repetat de 10 ori. Mișcările subiectului au fost surprinse de senzorii inerțiali încorporați ai unui smartphone atașat la xiphisternum cu ajutorul unei centuri elastice de neopren și a doi senzori BioKin, atașați la fiecare gleznă. Senzorul a fost poziționat astfel încât axele sale X, Y și Z să capteze mișcările ML (Medio-Lateral), AP (Antero-Posterior) și VT (axa verticală). În fiecare axă ortogonală (X, Y și Z), descrierea domeniului de frecvență a fost utilizată pentru a capta rezonanța11. Pentru fiecare subiect, magnitudinea și rezonanța au fost utilizate în fiecare axă pentru a forma un vector de caracteristici. O altă caracteristică, măsurarea neregularității vitezei pe bază de entropie fuzzy pentru anomalia trunchială (VI) a fost aleasă în studiu11 pentru a măsura aleatoritatea mersului sau nivelul de incertitudine în timpul mersului. Studiul in23 a introdus entropia fuzzy (FuzzyEn) pentru a capta ataxia trunchială.

cu referire la cohorta ataxică înscrisă în studiul nostru, pentru cei cu un scor SARA 7 pentru mers – în cazul în care este necesar un ajutor pentru mers, pacientul este rugat să efectueze testul cu ajutorul ajutorului adecvat pentru mers (adică un singur punct sau un cadru cu patru roți (4wf)).

dimensiuni Ataxice (stea)

lucrările lui Gordon Holmes sunt adesea citate ca având o influență fundamentală asupra înțelegerii noastre a simptomelor clinice și a semnelor leziunilor cerebeloase2,3,24. În studiul nostru, am revizuit abordarea lui Holmes de a caracteriza mișcarea subiectului cu disfuncție cerebeloasă în termeni de patru dimensiuni (stabilitate, sincronizare, precizie & ritmicitate).

  • stabilitate (e): aceasta se referă la stabilitatea platformei (de execuție). Platforma este articulațiile și mușchii care sunt relativ fixați și permit părții corpului în mișcare să execute cu exactitate o sarcină. De exemplu, sarcina DDK necesită o stabilitate relativă a flexiei și extensiei umărului și cotului pentru o execuție eficientă. Instabilitatea relativă are ca rezultat o creștere a mișcărilor inutile în axele secundare.

  • Timing (T): când CA este prezent, se constată că sarcinile care au o constrângere de timp, cum ar fi BAL, au o latență crescută înainte de începerea mișcării și sarcina este executată la o viteză mai mică, deoarece se ia un curs mai puțin direct. Aceleași caracteristici sunt adesea evidente chiar și în absența constrângerilor de timp. Aceste caracteristici sunt mai evidente atunci când CA este mai severă, sugerând că, subconștient, sincronizarea este un compromis neutru pentru a finaliza sarcina. În termeni computaționali, am recunoscut-o ca fiind eroarea dintre obiectiv și ceea ce se realizează, probabil să fie afectată de următoarele două:

  • timpul pentru ca subiectul să inițieze un moment.

  • timp pentru a finaliza o mișcare (viteză).

    • precizie (a): conceptual, o sarcină poate fi finalizată încet, dar urmează cea mai eficientă țintă. În aceste condiții, vom considera că aceasta este o performanță” exactă”. Atunci când o cale mai puțin directă este urmat (de exemplu, în sarcina BAL) sau există sub sau peste trage, atunci sarcina va fi ‘erori’ în comparație cu o performanță de control (recunoscând că acest lucru poate fi, de asemenea, asociate cu erori de sincronizare). În termeni computaționali, în acest studiu îl recunoaștem ca eroare între obiectivul/obiectivele spațiale față de ceea ce se realizează într-un context spațial (static).

    • ritmicitatea (R): neregularitate în mișcările repetate.

caracteristicile pentru fiecare test din sistemul nostru COA propus sunt atribuite dimensiunilor menționate mai sus prin următoarea abordare în 2 pași:

  1. (a) axa de execuție este direcția mișcării primare necesare pentru executarea sarcinii intenționate și ar atribui ritmicității sau dimensiunii de sincronizare.

    (b) orice abatere de la calea cea mai eficientă sau cea standard necesară pentru executarea sarcinii ar fi considerată drept caracteristici de precizie.

  2. mișcările excesive din celelalte axe ar fi considerate mișcări secundare și ar fi atribuite dimensiunii de stabilitate.

o reprezentare picturală în Fig. 2 ilustrează interpretarea stea pentru fiecare domeniu, conform abordării propuse în 2 pași.

Figura 2

criterii de etichetare a stelelor.

în testele repetitive (DDK, FNT, FIN, FOO, HST), frecvența de rezonanță de-a lungul axei y (primară) contribuie la viteză și, prin urmare, este considerată o caracteristică de sincronizare, în timp ce magnitudinea rezonanței este considerată o caracteristică ritmică. Mișcările/perturbațiile secundare prezente în alte axe sunt denumite caracteristici de stabilitate.

pentru testele bazate pe țintă (BAL), orice întârziere în mișcarea primară de urmărire a țintei este considerată o caracteristică de sincronizare; cât de bine este îndeplinită o țintă sau orice grad de abatere în îndeplinirea țintei definește performanța participantului și, prin urmare, măsoară acuratețea; orice altă caracteristică care se referă la mișcări excesive/ineficiente este marcată sub stabilitate.

testul de mers constă în mersul înainte în linie dreaptă (de-a lungul axei AP) într-un ritm regulat, ridicând și așezând fiecare picior într-un mod ritmic. Acest lucru ar deduce informații de ritmicitate, în timp ce amploarea legănării trunchiale de la axa AP (adică mișcarea în axa ML) va deduce informații de precizie. Mai mult, orice balansare nedorită în axa VT este considerată caracteristică de stabilitate.

pentru testul de echilibru, se așteaptă ca un participant să mențină o poziție dreaptă constantă de-a lungul axei VT. Aceasta fiind mișcarea lor principală, orice abatere sau balansare în axa VT va explica inexactitatea și orice altă balansare trunchială nedorită în AP sau ML sunt considerate caracteristici de stabilitate.

pentru testul de vorbire, caracteristicile care măsoară natura ritmică a enunțurilor repetate/ ta/, de exemplu, decalajul dintre enunțurile consecutive/ ta/, durata a/ ta / sunt considerate caracteristici de ritmicitate și caracteristica de frecvență rezonantă ca caracteristică de sincronizare. Raportul de amortizare mai mic indică o oscilație mai mare. Prin urmare, raportul de amortizare mai mic al a /ta/ enunț, ca caracteristică acustică ataxică, indică instabilitatea tractului vocal în timpul articulației vocale.

Un rezumat al celor nouă teste în 5 domenii, generând 172 de caracteristici, este prezentat cu interpretarea lor stelară în tabelul 2.

evaluarea clinică

CA a fost evaluată de un clinician cu experiență conform scalei SARA, în timp ce subiecții cu ataxie au efectuat fiecare sarcină. SARA este o scală clinică dezvoltată de Schmitz-h Inciftbsch și colab.25,26 care evaluează o serie de deficiențe diferite în ataxia cerebeloasă, variind de la vorbire la echilibru. Scara este alcătuită din 8 categorii cu scoruri variind ca, mers (0-8 puncte), poziție (0-6 puncte), șezut (0-4 puncte), tulburări de vorbire (0-6 puncte), urmărire cu degetul (0-4 puncte), test nas-deget (0-4 puncte), mișcare rapidă alternativă a mâinii (0-4 puncte), diapozitiv toc-tibie (0-4 puncte). Odată ce clinicianul evaluează fiecare dintre cele 8 categorii pentru un individ, acesta poate calcula în continuare scorul cumulat variind de la 0 (fără ataxie) la 40 (cea mai severă ataxie) pentru a determina severitatea ataxiei subiectului ataxic. În studiul nostru, pentru a evita orice părtinire subiectivă, un clinician a evaluat toate sarcinile.

schema de evaluare pe 3 niveluri a sistemului COA

tehnicile care trebuie încorporate în sistemul instrumentat propus (sistemul COA) sunt demonstrate printr-o diagramă (Fig. 3) și prezentate în următoarele subsecțiuni.

Figura 3

diagrama procesului de evaluare pe 3 niveluri a sistemului COA.

reducerea caracteristicilor și analiza statistică

extragerea caracteristicilor originale pentru fiecare test s-au bazat pe studii anterioare relevante4,6,7,8,9,10,11. Un total de 172 de caracteristici au fost identificate ca fiind critice pentru evaluarea obiectivă a testelor individuale. Măsurătorile de proces conțin multe date corelate sau redundante. Este important să le eliminați și să extrageți caracteristicile care au cea mai independentă relevanță. Analiza componentelor principale (PCA)27 este un instrument de comprimare, extragere și vizualizare a datelor utilizat pentru a transforma mai mulți factori asociați într-un grup de variabile necorelate. PCA este utilizat pentru a comprima caracteristicile originale 172 în 27 buc (3 buc din fiecare dintre cele 9 teste) (Fig. 3). Mai mult, informațiile critice nu provin dintr-o singură variabilă a unui test individual, ci provin frecvent din relația dintre variabile, adică modul în care acestea co-variază. PCA este cea mai potrivită dintre metodele statistice multivariate utilizate în mod obișnuit pentru evaluarea acestor informații, deoarece poate gestiona un număr mare de factori foarte corelați, zgomotoși și redundanți.

valoarea p pentru testarea ipotezelor este calculată pentru distribuțiile celor 3 buc (PCs 1-2-3) rezultate ale fiecărui test în raport cu fiecare dintre cele 5 domenii (vorbire, membre superioare, membre inferioare, mers, echilibru) pentru a determina dacă grupurile de subiecți (control și ataxic) diferă semnificativ. În fiecare domeniu, indivizii cu măsuri SARA mai mari decât zero, sunt grupați ca ataxici, iar controalele și subiecții care au obținut un scor SARA de 0 pentru un anumit test sunt grupați în mod normal. Testele statistice neparametrice (Kolmogorov”Smirnov (KS) și Mann-Whitney-Wilcoxon (MWW)) sunt adoptate pentru a evita ipotezele privind distribuția datelor.

Teoria grafurilor&măsuri de centralitate

cuantificarea vizuală a dependențelor de test/domeniu

Teoria grafurilor este aplicată pentru a obține informații suplimentare despre relațiile dintre teste și domenii. Testele și domeniile au fost atribuite nodurilor unei rețele, care au unit nodurile prin muchii cu lungimi reprezentând coeficienții de corelație a rangului lui Spearman (XV). Centralitatea unui nod indică numărul de muchii adiacente acelui nod și apropierea de toate celelalte noduri, care este considerată o indicație a importanței nodului. Frecvența pe care un nod apare pe cea mai scurtă cale între alte două noduri este, de asemenea, o măsură de importanță. Analiza arborelui minim de acoperire (MST) 28 este utilizată în studiul nostru ca o măsură fiabilă pentru compararea rețelelor între diferite grupuri, deoarece este imparțială și nu necesită setări arbitrare ale parametrilor29. MST a fost aplicat recent doar rețelelor cerebrale29 și identificarea genelor critice în diabetul zaharat30. MST este un subgraf care conectează toate nodurile pentru a reduce lungimea totală a marginii. În acest sens, MST este rețeaua „backbone” care încapsulează dependențele inter-test/domeniu. Pentru a măsura proximitatea, folosim următoarea mapare pentru a traduce coeficienții de corelație a rangului lui Spearman (XV) în distanțe.

$ $ f (\rho )=1-\rho ,$$
(1)

$$sau,f (\rho) =\sqrt{2 (1- \ rho )}.$$
(2)

MST al acestui grafic este calculat prin atribuirea testelor / domeniilor nodurilor unei rețele și unirea nodurilor prin muchii cu lungimi date de către XV.

Prezentare generală a importanței testului / domeniului folosind măsuri de centralitate a graficului

reprezentarea testelor și domeniilor într-o formă de grafic permite cuantificarea relațiilor dintre ele. Deoarece graficele matematice caracterizează intrinsec măsurătorile de semnificație a nodului, testele/domeniile atribuite acestor noduri sunt considerate foarte relevante în măsurarea CA. Scorul de importanță caracteristică este apoi calculat pe întregul grafic folosind măsuri centralitate populare, cum ar fi gradul de centralitate, centralitate apropierea și Betweenness30. Incidența sau gradul de centralitate al unui nod într-un grafic dat numără numărul de muchii adiacente acelui nod care este definit matematic ca,

$${c}_{d}(n)={\rm{\deg }}(n),$$
(3)

unde, g := (n, e) este graficul dat cu |n| noduri și |e| muchii. Într-un grafic conectat, lungimea medie a celei mai scurte căi dintre nod și toate celelalte noduri din rețea este notată ca centralitatea normalizată a apropierii (sau apropierea) unui nod. Prin urmare, o valoare ridicată a apropierii implică faptul că nodul este central sau semnificativ. Apropierea este definită ca reciproca sumei distanțelor de la nod la toate celelalte noduri, adică

$${C}_{C}({N}_{1})=\frac{1}{{\sum }_{y}d({n}_{2}, {N}_{1})},$$
(4)

unde d(N1, N2) este distanța dintre vârfurile N1 și N2. De asemenea, Betweenness unui nod calculează cât de frecvent acel nod apare între alte două noduri în grafic pe calea cea mai scurtă. O valoare ridicată a Betweenness înseamnă nodul este relevant. Între un nod N este notat ca,

$ $ {c} _ {b}(n \ rangle = \ sum _ {{n}_{1}\ne n\ne {n}_{2}\în N}\,\frac{{\sigma }_{{N}_{1}{N}_{2}}(n\rangle }{{\sigma } _ {{n} _ {1}{N}}_{2}}},$$
(5)

experiment de clasificare

clasificare binară

următoarea etapă a schemei constă într-un diagnostic sau o problemă de clasificare binară care compară performanța de discriminare a fiecăruia dintre testele individuale, testul combinat 9 și două subseturi reduse utilizând un clasificator Random Forest (RF) 31. Fiecare caracteristică a contribuit la fiecare dintre cele 4 dimensiuni Holmeshiene în grade diferite (greutățile) care au fost calculate în consecință pentru testul total 9, precum și pentru subsetul optim de teste.

clasificare Multilabel

în studiul nostru, se folosește un algoritm adoptat aleatoriu pe bază de pădure pentru clasificarea Multilabel32.

introducerea caracteristicii în problema clasificării pe mai multe etichete a studiului nostru a constat din 27 de componente principale din toate testele (3 buc x 9 teste). Obiectivul a fost identificarea dizabilităților în 5 domenii (0: normal; 1: ataxic). De exemplu, un participant este reprezentat de domeniile vorbirii, membrelor superioare, membrelor inferioare, mersului și echilibrului; iar posibila reprezentare a etichetei powerset a acesteia este o problemă de clasificare multi-clasă cu clasele , , , , , , , , …, unde, de exemplu, denotă un participant ale cărui domenii de vorbire și membre inferioare sunt afectate, în timp ce domeniile membrelor superioare, mersului și echilibrului nu sunt afectate.

importanța caracteristicii (sau rang) în modelul RF

la început, dimensiunea optimă a frunzei într-un clasificator RF este verificată prin compararea erorilor medii pătrate (MSE) obținute prin clasificare pentru diferite dimensiuni ale frunzelor (5, 10, 20, 50 și 100). Dimensiunea optimă a frunzelor ar trebui să producă cele mai mici valori MSE. Odată ce am estimat dimensiunea optimă a frunzelor, un ansamblu mai mare este cultivat și utilizat pentru a estima importanța caracteristicilor. Pentru a calcula importanța caracteristicii în modelul de diagnostic forestier aleatoriu, inițial, se calculează MSE al modelului cu variabilele originale. Apoi, valorile unei singure coloane (reprezentând caracteristica 1 Pentru n observații) sunt permutate și MSE este calculat din nou. De exemplu, dacă o coloană ia valorile caracteristicii x1, x2, x3, x4 și o permutare aleatorie a valorilor are ca rezultat x4, x3, x1, x2; atunci aceasta va duce la un nou MSE. Diferența în MSE este medie pentru toți copacii din ansamblu și împărțită la abaterea standard preluată asupra copacilor pentru fiecare variabilă. Cu cât această valoare este mai mare, cu atât variabila este mai semnificativă. Diferența este de așteptat să fie pozitivă, dar dacă este un număr negativ, atunci implică faptul că permutarea aleatorie a funcționat mai bine deducând că caracteristica nu are un rol în predicție și nu este considerată importantă.

calculul stelelor

odată ce importanța/rangul celor 3 caracteristici PC este evaluat pentru un test specific prin schema de clasare aleatorie a pădurilor, greutatea caracteristicii originale este calculată după cum urmează:

$$feature\_weights=WOF\_inpc{1}^{\ast }r\_PC1+WOF\_inpc{2}^{\ast }r\_PC2+WOF\_inpc{3}^{\ast }r\_PC3,$$
(6)

unde WOF: greutatea acestei caracteristici într-o componentă PC; r: rangul funcției PC în modelul RF. Deoarece fiecare caracteristică se referă la una dintre cele 4 dimensiuni Holmeshiene, contribuția dimensiunii generale de stabilitate, sincronizare, precizie și ritmicitate este greutatea acumulată a tuturor caracteristicilor de stabilitate, sincronizare, precizie și ritmicitate.

validare încrucișată (CV)

pentru ambele probleme de clasificare, datele sunt stratificate folosind o tehnică Leave-one-out (LOO) CV. Validarea încrucișată în setările multilabel este complicată de faptul că metoda obișnuită (binară/multiclasă) de eșantionare stratificată nu este aplicabilă; au fost sugerate modalități alternative de eșantionare stratificată aproximativă33. Deci, în studiul nostru, stratificarea cu mai multe etichete a fost efectuată folosind o tehnică iterativă.

valori de evaluare

performanța Clasificatorului este evaluată folosind valorile, precizia, rechemarea, scorul F1, precizia și coeficientul de corelație Matthews (MCC)34. Aceste valori sunt calculate pentru fiecare domeniu pe baza valorilor prezise după fiecare validare în LOO (de 34 de ori). Precizia generală, rechemarea, scorul F1, precizia problemei clasificării multilabel sunt media rezultatelor prin LOO în cele 5 domenii. De exemplu,

$$general\_precision=sum(precision\_values\_in\_5\_domains) / 5.$$
(7)

clasarea caracteristicilor printr-un tren RF& validarea cu LOO este media tuturor rangurilor din fiecare fază de formare și validare, atât pentru problemele de clasificare binară, cât și pentru cele multilabel.