Articles

Valutazione oggettiva dell’atassia cerebellare: un approccio completo e raffinato

Sistema di valutazione oggettiva completa (COA)

In questo studio, abbiamo utilizzato BioKin17, una piattaforma di sensori di acquisizione del movimento in tempo reale basata su cloud per eseguire una valutazione oggettiva BioKin17 è un dispositivo indossabile wireless con un accelerometro triassiale incorporato (chipset modello “MPU-9150” di InvenSense, Inc., San Jose, CA, Stati Uniti d’America) e un IEEE802.11b / g / n / wireless interfaccia di comunicazione in esecuzione su un processore ARM a 32 bit. Il sistema di sensori BioKin sviluppato da Networked Sensing and Control Lab, Deakin University, può interagire con un’applicazione mobile Android per catturare movimenti complessi di un corpo umano in tempo reale, come illustrato in Fig. 1. È ottimizzato per ridurre gli effetti di assestamento e i problemi di deriva del sensore eliminando gli errori di allineamento tra assi a livello di scheda tra ciascun sensore inerziale17. Questo sensore è stato contrassegnato da un sistema di tracciamento ottico basato su telecamere multiple (Vicon system, T40S, Oxford, UK), un sistema di marcatura da banco ad alta precisione18. BioKin ha catturato i dati del giroscopio e dell’accelerazione nelle coordinate cartesiane tridimensionali (3D) a una frequenza di campionamento di 50 Hz. La valutazione CA è stata eseguita attraverso i seguenti passaggi:

  1. Input di movimento generati da nove test strumentati che imitano i nove test clinici standard di CA che coprono i 5 domini.

  2. Questi vengono catturati dai sensori e visualizzati con un’applicazione di supporto in uno smartphone.

  3. Trasmissione wireless a una rete cloud distribuita basata su blockchain 19 in cui vengono applicati algoritmi di diagnostica e valutazione.

  4. I risultati dell’analisi dei dati vengono trasformati in un formato clinicamente rilevante.

In Fig. 1.

Input di movimento

I soggetti sono stati fatti per eseguire nove test clinici standard; sillaba ripetuta (SPE), dito ritmico toccando (FIN), dito-naso/naso-dito (FNT), dysdiadochokinesia (DDK), inseguimento balistico/finger-chase (BAL), tallone-shin (HST), piede toccando (FOO), stance/romberg (ROM) e andatura (WAL). Le attività vengono eseguite in linea con le istruzioni specificate in SARA che coprono tutti i 5 domini. Per evitare eventuali fattori confondenti dovuti all’oscillazione durante l’esecuzione dei test in posizione seduta, ai partecipanti è stato fornito un supporto assiale, ovvero seduti comodamente in posizione verticale. Il supporto dello schienale della sedia è stato angolato a 90-100 gradi con un adeguato supporto del legname in linea con la parte bassa della schiena. Sono stati valutati sia gli arti destro che sinistro.

Acquisizione dati

Il sistema COA ha utilizzato unità di misura inerziali (IMU) equipaggiate nel sistema BioKin in sette dei test per catturare la cinematica traslazionale e rotazionale in assi ortogonali tramite accelerometri e giroscopi. Una fotocamera Microsoft Kinect V2 dotata di un monitor da 23 pollici e mini PC con processore Intel core i5 è stata utilizzata anche in uno dei test per la motion capture basata su marker e per ottenere le informazioni sulla posizione assoluta.

Algoritmi basati su cloud

I dati registrati vengono quindi trasferiti alla rete cloud distribuita basata su blockchain 19 tramite la connessione wireless per la successiva elaborazione dei dati che consente ai medici di acquisire punteggi di gravità. Gli ambienti MATLAB (R2019a, MathWorks) e Python hanno elaborato i dati trasmessi tramite mezzi wireless.

Clinical output

I dati acquisiti vengono visualizzati tramite l’applicazione smart phone basata su Android, BioKin che genera report di valutazione e punteggi di gravità come risultato dell’elaborazione dei dati basata su cloud.

Nel nostro sistema COA, la spesa temporale media nell’acquisizione dei dati tramite motion capture da ciascuno dei test periferici 6 (DDK, FNT, FIN, BAL, FOO, HST) è inferiore a 15 secondi. Il test di equilibrio(ROM) richiede meno di 30 secondi; il test di andatura (WAL) richiede meno di 90 secondi mentre il test vocale (SPE) richiede meno di 5 secondi per acquisire i dati. Quindi, la spesa temporale media per acquisire dati e generare un risultato cumulativo del test (utilizzando algoritmi basati su cloud) per un singolo paziente è approssimativamente inferiore a 215 secondi e 5 secondi rispettivamente. Il set di test richiede in genere fino a 30 secondi.

Progetto sperimentale

Partecipanti

Per un’analisi approfondita delle anomalie attribuite a timing, stabilità, accuratezza e ritmicità nei movimenti motori, discorso e dati cinematici sono stati registrati da 34 soggetti la cui lingua madre era l’inglese. Ventitré sono stati precedentemente diagnosticati con un’atassia cerebellare (CA) a causa di un disturbo neurodegenerativo e frequentato la clinica di neurologia presso il Royal Victorian Eye and Ear Hospital (RVEEH) o Alfred Hospital di Melbourne. Undici soggetti normali (controlli) erano volontari senza alcuna storia di condizioni neurologiche o altri disturbi del linguaggio. Sintesi delle statistiche di coorte sono riportati nella Tabella 1. Nessuno dei partecipanti (controls e CA) aveva subito alcun programma di riabilitazione prima di questa indagine clinica. Nessuno dei partecipanti (controls e CA) aveva subito alcun programma di riabilitazione prima di questa indagine clinica. Una revisione della letteratura20,21, 22 ha rivelato che l’età di esordio, l’età della diagnosi e altri fattori demografici non influenzano l’età e il gmoender correlato all’atassia. Poiché il nostro studio era limitato a una coorte di atassia ad esordio adulto, la stretta aderenza ai criteri di età e sesso corrispondenti non era fattibile.

Tabella 1 Caratterizzazione clinica dei partecipanti arruolati.

Etica di approvazione e di consenso alla partecipazione

Questo studio è stato approvato dalla Ricerca Umana e di un Comitato Etico, Reale Vittoriano Eye and Ear Hospital, a Est di Melbourne, in Australia (HREC Numero di Riferimento: 11/994H/16) e supportato da Florey Istituto di Neuroscienze e di Salute Mentale, di Melbourne, in Australia, attraverso il National Health and Medical Research Council (nhmrc intitolata) Borsa: GNT1101304 e APP1129595. Tutti i metodi in questo studio sono stati eseguiti in conformità con le linee guida e le normative pertinenti e il consenso scritto è stato ottenuto da tutti i partecipanti prima della loro iscrizione. Il consenso informato è stato ottenuto da entrambi i soggetti per pubblicare le immagini raffigurate nella Fig. 1.

Testing protocol and feature extraction

Le valutazioni oggettive dei nove test neurologici sono raggruppate nei seguenti 5 domini con una breve descrizione del loro protocollo di esecuzione. Un riassunto delle caratteristiche che si sono rivelate fondamentali nella diagnosi di CA nel relativo rispettivo studio4,6,7,8,9,10,11 è stato inoltre incluso per ogni sottosezione di prova nella tabella 2.

Tabella 2 Breve descrizione della caratterizzazione STELLARE delle 172 caratteristiche estratte dai 9 test neurologici.

Speech

  • Espressione sillabica ripetuta (SPE): Al candidato era richiesto di ripetere la sillaba consonante-vocale/ta/ per 5 secondi alla velocità preferita. Le registrazioni sono state effettuate utilizzando un microfono a condensatore ritagliato ad una distanza approssimativa di 10 cm dalla bocca del soggetto in una stanza tranquilla con basso livello di rumore ambientale. Un telefono Android che utilizza il programma BioKinMobi sotto la supervisione di un investigatore professionista ha catturato il discorso. Un algoritmo automatizzato basato sulla prominenza topografica è stato impiegato per estrarre sei caratteristiche acustiche dal treno di espressioni ripetute/ta/ sillabe4,6.

  • La regolarità della durata misura la variabilità del ritmo dell’enunciato ripetuto/ ta / (RT). Questo è identificato come una misura integrale dei deficit di temporizzazione estratti dai dati dell’onda al 50% di prominenza.

  • Gap regolarity misura la variabilità della differenza di tempo tra due picchi consecutivi/ ta / sillaba.

  • La prominenza media del picco ha misurato l’elevazione/picco relativo medio per uno specifico/ ta / impulso considerato.

  • La regolarità della compensazione ha misurato la variabilità delle differenze calcolate tra il picco e la sua prominenza corrispondente per uno specifico impulso/ta / sillabico.

  • Rapporto di smorzamento misurato la media dei rapporti di smorzamento delle/ ta / sillabe calcolati dai dati dell’onda estratti al 75% di prominenza.

  • Frequenza di risonanza misurata la media della frequenza di risonanza/ ta / sillabe calcolata sui dati d’onda estratti al 50% di prominenza.

Arto superiore

  • Rhythmic finger tapping test (FIN): I partecipanti hanno toccato ritmicamente il dito indice contro una superficie orizzontale (ad esempio il piano del tavolo) alla velocità e alla durata preferite. Un BioKin è stato montato sul dorso del dito indice di puntamento per l’acquisizione dei dati. Le prime 3 componenti principali (PC) dell’entropia multiscala misurate dagli assi X e Z dei segnali accelerometrici e dall’asse X dei segnali giroscopici e il coefficiente di variazione dell’intervallo inter-tap che misura l’irregolarità del ritmo sono state le caratteristiche selezionate7.

  • Dito-naso di prova (FNT): Ai partecipanti è stato richiesto di toccare il naso con l’indice appuntito e quindi, usando lo stesso dito, allungare la mano e toccare il dito del clinico posto a circa 25 cm dal naso del soggetto. I movimenti della mano sono stati misurati da un BioKin attaccato al dorso della mano del dito indice puntato. La frequenza di risonanza e l’ampiezza alla frequenza di risonanza erano le caratteristiche critiche8 catturate dal BioKin attaccato al palmo dell’indice puntato. La descrizione del dominio di frequenza dell’accelerazione e della velocità angolare è stata utilizzata per catturare la risonanza in ciascun asse ortogonale (X, Y e Z)8.

  • Dysdiadochokinesia test (DDK): Ai partecipanti è stato richiesto di posizionare il dorso di una mano sul palmo dell’altra mano, come illustrato in Fig. 1. I partecipanti sono stati quindi istruiti a pronare la mano, in modo che il lato del palmo sia rivolto verso il basso per riposare sul palmo dell’altra mano. Il soggetto è anche incaricato di pronare e supinare alternatamente tra queste due posizioni nel modo più veloce e preciso possibile. Il tasso di alternanza viene estratto dall’IMU del BioKin attaccato al polso. Questo test ha esaminato l’incapacità di coordinare il movimento. Il tasso di alterazione del pronato e del supinato, la frequenza di risonanza e l’ampiezza alla frequenza di risonanza erano le caratteristiche critiche8.

  • Ballistic Tracking (BAL): ai partecipanti è stato richiesto di puntare al bersaglio su uno schermo monitor. Il movimento del dito indice di puntamento è stato rilevato utilizzando la fotocamera Kinect ed è stato presentato come un marcatore sullo schermo. L’obiettivo è quello di seguire con precisione il bersaglio tramite il marcatore proiettato (con la telecamera Kinect) sullo schermo quando il bersaglio si muove rapidamente e casualmente da un punto all’altro sul monitor. Le seguenti caratteristiche estratte hanno mostrato un significativo livello di correlazione con il livello di disabilità catturato dalla misura clinica standard SARA9:

  • Errore: La distanza tra le traiettorie del marcatore e del bersaglio, misurata utilizzando il metodo di deformazione dinamica del tempo nell’asse orizzontale(H) e verticale(V).

  • Tempo di ritardo completo: Questo è stato calcolato come la correlazione incrociata per la sequenza, il marcatore e il bersaglio due volte.

  • Ritardo cinematico: Questo è stato ottenuto utilizzando l’indice di misurazione delle prestazioni nella legge di Fitts. La caratteristica è di misurare le prestazioni del soggetto nel raggiungere una posizione di destinazione.

  • Cambiamento direzionale negli assi H e V: Questo è il numero di volte in cui il partecipante ha alterato la propria accelerazione che è stata misurata in termini di cambiamento direzionale. Questa funzione conteneva informazioni di over / undershooting, nonché le prestazioni del soggetto durante il test. Un livello più elevato di dismetria ha dedotto un tasso di errore maggiore in base alla differenza tra le traiettorie target e marker.

Arto inferiore

  • Heel-shin test (HST): ai partecipanti è stato richiesto di posizionare un tallone sul ginocchio opposto e eseguirlo lungo la tibia, tra il tallone e il ginocchio in modo ripetuto e il più accurato possibile. Il BioKin era attaccato al dorso del piede. La frequenza di risonanza e l’ampiezza alla frequenza di risonanza erano le caratteristiche critiche8.

  • Ritmica piede toccando (FOO): Ai partecipanti è stato richiesto di battere ritmicamente ogni piede contro una superficie orizzontale (ad esempio il pavimento). Le prime 3 componenti principali (PC) dell’entropia multiscala misurate dagli assi X e Z dei segnali accelerometrici e dall’asse X dei segnali giroscopici, e il coefficiente di variazione dell’intervallo inter-tap che misura l’irregolarità del ritmo sono state le caratteristiche selezionate7.

Equilibrio

  • Romberg test (ROM): ai partecipanti è stato richiesto di stare con i piedi uniti e poi con i piedi separati, le braccia ai lati il più a lungo possibile (fino a 30 secondi); prima con gli occhi aperti e poi con gli occhi chiusi. Un BioKin è stato posizionato approssimativamente sullo xiphisternum per mezzo di una cintura elastica in neoprene. Il secondo BioKin era attaccato nella parte superiore della schiena, nella linea mediana appena sotto il collo. La tecnica Fuzzy entropy è stata impiegata sulla velocità di oscillazione posturale dedotta dalle accelerazioni troncali misurate. I valori di entropia23 della velocità dedotta sono stati considerati principalmente come una misura del controllo motorio neurale durante una postura eretta tranquilla di cui una parte significativa è proporzionale alla velocità di oscillazione del corpo. L’incertezza nella misurazione della velocità conteneva un livello significativo di informazioni rispetto all’instabilità troncale10.

Andatura

  • Test di andatura (WAL): ai partecipanti è stato richiesto di camminare per 5 metri e tornare che è stato ripetuto 10 volte. I movimenti del soggetto sono stati catturati dai sensori inerziali incorporati di uno smartphone collegato allo xiphisternum per mezzo di una cintura elastica in neoprene e due sensori BioKin, attaccati a ciascuna caviglia. Il sensore è stato posizionato in modo che i suoi assi X, Y e Z catturassero rispettivamente i movimenti ML (Medio-Laterale), AP (Antero-Posteriore) e VT (Asse verticale). In ogni asse ortogonale (X, Y e Z), la descrizione del dominio della frequenza è stata utilizzata per catturare la risonanza11. Per ogni soggetto, la grandezza e la risonanza sono state utilizzate in ciascun asse per formare un vettore di funzionalità. Un’altra caratteristica, la misura fuzzy dell’irregolarità della velocità basata sull’entropia per l’anomalia troncale (VI) è stata scelta nello studio11 per misurare la casualità dell’andatura o il livello di incertezza durante la deambulazione. Lo studio in23 ha introdotto l’entropia fuzzy (FuzzyEn) per catturare l’atassia troncale.

In riferimento alla coorte atassica iscritta al nostro studio, per chi ha un punteggio SARA 7 per la deambulazione – nel caso in cui sia richiesto un ausilio per l’andatura, al paziente viene richiesto di eseguire il test con l’utilizzo dell’apposito ausilio per l’andatura (ovvero un bastone a punto singolo o un telaio a quattro ruote (4WF)).

Dimensioni atassiche (STELLA)

Le opere di Gordon Holmes sono spesso citate come aventi un’influenza fondamentale sulla nostra comprensione dei sintomi clinici e dei segni delle lesioni cerebellarie2,3,24. Nel nostro studio, abbiamo rivisitato l’approccio di Holmes di caratterizzare il movimento del soggetto con disfunzione cerebellare in termini di quattro dimensioni (Stabilità, Timing, Accuratezza & Ritmicità).

  • Stabilità (S): Questo si riferisce alla stabilità nella piattaforma (di esecuzione). La piattaforma è le articolazioni e i muscoli che sono relativamente fissi e consentono alla parte del corpo in movimento di eseguire un’attività con precisione. Ad esempio, l’attività DDK richiede la stabilità relativa della flessione e dell’estensione della spalla e del gomito per un’esecuzione efficiente. L’instabilità relativa si traduce in un aumento dei movimenti non necessari negli assi secondari.

  • Timing (T): quando è presente CA, le attività che hanno un vincolo di tempo, come BAL, di solito si trovano ad avere una maggiore latenza prima che inizi il movimento e l’attività venga eseguita a una velocità più lenta, perché viene presa una rotta meno diretta. Le stesse caratteristiche sono spesso evidenti anche in assenza di vincoli di tempo. Queste caratteristiche sono più evidenti quando la CA è più grave, suggerendo che, inconsciamente, il tempismo è un compromesso neutrale per completare l’attività. In termini computazionali, lo abbiamo riconosciuto come l’errore tra l’obiettivo e ciò che viene raggiunto, probabilmente influenzato dai seguenti due:

  • Tempo per il soggetto di iniziare un momento.

  • Tempo per completare un movimento (velocità).

    • Precisione (A): Concettualmente, un’attività potrebbe essere completata lentamente ma seguire l’obiettivo più efficiente. In queste circostanze considereremo questa una performance “accurata”. Quando viene seguito un percorso meno diretto (ad esempio nell’attività BAL) o c’è under o over shoot, allora l’attività sarà “errori” rispetto a una performance di controllo (riconoscendo che questo può anche essere associato a errori di temporizzazione). In termini computazionali, in questo studio lo riconosciamo come errore tra gli obiettivi obiettivo / spazio rispetto a ciò che viene raggiunto in un contesto spaziale (statico).

    • Ritmicità (R): Irregolarità nei movimenti ripetuti.

Le caratteristiche per ogni test nel nostro sistema COA proposto sono assegnate alle dimensioni di cui sopra attraverso il seguente approccio in 2 fasi:

  1. (a) L’asse di esecuzione è la direzione del movimento primario richiesto per eseguire il compito previsto e attribuirebbe alla ritmicità o alla dimensione temporale.

    (b) Qualsiasi deviazione dal percorso più efficiente o standard richiesto per eseguire l’attività sarà considerata come funzionalità di precisione.

  2. Movimenti eccessivi negli altri assi sarebbero considerati movimenti secondari e attribuibili alla dimensione di stabilità.

Una rappresentazione pittorica in Fig. 2 illustra l’interpretazione della STELLA per ogni dominio, secondo l’approccio proposto in 2 fasi.

Figura 2

Criteri di etichettatura A STELLA.

Nei test ripetitivi (DDK, FNT, FIN, FOO, HST), la frequenza di risonanza lungo l’asse y (primario) contribuisce alla velocità e quindi è considerata come una funzione di temporizzazione, mentre la grandezza della risonanza è considerata come una caratteristica ritmica. I movimenti secondari / disturbo presenti in altri assi sono definiti come caratteristiche di stabilità.

Per i test basati sul bersaglio (BAL), qualsiasi ritardo nel movimento primario di inseguire il bersaglio è considerato come una funzione di temporizzazione; quanto bene un obiettivo è raggiunto o qualsiasi grado di deviazione nel raggiungere l’obiettivo definisce le prestazioni del partecipante e quindi misura l’accuratezza; qualsiasi altra caratteristica che si riferisce a movimenti eccessivi/inefficienti è contrassegnata sotto stabilità.

Il test dell’andatura consiste nel camminare in avanti in linea retta (lungo l’asse AP) ad un ritmo regolare sollevando e abbassando ogni piede in modo ritmico. Ciò dedurrebbe informazioni sulla ritmicità mentre l’estensione dell’oscillazione troncale dall’asse AP (cioè il movimento nell’asse ML) dedurrà informazioni sull’accuratezza. Inoltre, qualsiasi ondeggiamento indesiderato nell’asse VT è considerato come caratteristica di stabilità.

Per il test di equilibrio, si prevede che un partecipante mantenga una postura dritta costante lungo il proprio asse VT. Essendo questo il loro movimento primario, qualsiasi deviazione o ondeggiamento nell’asse VT terrà conto dell’inesattezza e qualsiasi altro ondeggiamento troncale indesiderato in AP o ML è considerato come caratteristiche di stabilità.

Per il test vocale, le caratteristiche che misurano la natura ritmica delle /ta/ utterances ripetute, ad esempio, il divario tra /ta/ utterances consecutive, la durata di a /ta/ sono considerate come caratteristiche di ritmicità e la funzione di frequenza di risonanza come funzione di temporizzazione. Rapporto di smorzamento inferiore indica una maggiore oscillazione. Quindi, il rapporto di smorzamento inferiore di a/ ta / utterance, come caratteristica acustica atassica, indica l’instabilità del tratto vocale durante l’articolazione della voce.

Un riassunto dei nove test in 5 domini, generando 172 caratteristiche è presentato con la loro interpretazione STELLARE nella Tabella 2.

La valutazione clinica

CA è stata valutata da un clinico esperto secondo la scala SARA mentre i soggetti con atassia eseguivano ogni attività. SARA è una scala clinica sviluppata da Schmitz-Hübsch et al.25,26 che valuta una serie di diverse menomazioni nell’atassia cerebellare, che vanno dalla parola all’equilibrio. La scala è composta da 8 categorie con punteggi che vanno come, andatura (0-8 punti), posizione (0-6 punti), seduta (0-4 punti), disturbi del linguaggio (0-6 punti), finger chase (0-4 punti), test naso-dito (0-4 punti), movimento veloce alternato della mano (0-4 punti), scivolo tallone-stinco (0-4 punti). Una volta che il clinico valuta ciascuna delle 8 categorie per un individuo, può ulteriormente calcolare il punteggio cumulativo che va da 0 (nessuna atassia) a 40 (atassia più grave) per determinare la gravità dell’atassia del soggetto atassico. Nel nostro studio, per evitare qualsiasi pregiudizio soggettivo, un clinico ha valutato tutti i compiti.

Schema di valutazione a 3 livelli del sistema COA

Le tecniche da incorporare nel sistema strumentato proposto (sistema COA) sono dimostrate attraverso un diagramma di flusso (Fig. 3) e delineato nelle seguenti sottosezioni.

Figura 3

Diagramma di flusso del processo di valutazione a 3 livelli del sistema COA.

Riduzione delle funzionalità e analisi statistica

L’estrazione originale delle funzionalità per ogni test si basava su studi precedenti pertinenti4,6,7,8,9,10,11. Un totale di 172 caratteristiche sono state identificate come critiche per la valutazione oggettiva dei singoli test. Le misurazioni di processo contengono molti dati correlati o ridondanti. È importante rimuoverli ed estrarre le caratteristiche che portano la rilevanza più indipendente. Principal Component Analysis (PCA)27 è uno strumento di compressione, estrazione e visualizzazione dei dati utilizzato per trasformare diversi fattori associati in un gruppo di variabili non correlate. PCA viene utilizzato per comprimere le 172 caratteristiche originali in 27 pezzi (3 pezzi da ciascuno dei 9 test) (Fig. 3). Inoltre, le informazioni critiche non provengono da una singola variabile di un singolo test, ma spesso derivano dalla relazione tra le variabili, cioè dal modo in cui esse co-variano. PCA è il più appropriato tra i metodi statistici multivariati comunemente usati per valutare tali informazioni perché può gestire un gran numero di fattori altamente correlati, rumorosi e ridondanti.

Il valore p per il test di ipotesi viene calcolato per le distribuzioni dei 3 PC risultanti (PC 1-2-3) di ciascun test rispetto a ciascuno dei 5 domini (Discorso, arto superiore, arto inferiore, andatura, equilibrio) per determinare se i gruppi di soggetti (controllo e atassico) differiscono in modo significativo. In ogni dominio, gli individui con misure SARA maggiore di zero, sono raggruppati come atassici, e controlli e soggetti che hanno segnato un punteggio SARA di 0 per un particolare test sono raggruppati come normale. I test statistici non parametrici (Kolmogorov—Smirnov (KS) e Mann-Whitney-Wilcoxon (MWW)) sono adottati per evitare ipotesi sulla distribuzione dei dati.

Teoria dei grafi&misure di centralità

Quantificazione visiva delle dipendenze test/dominio

La teoria dei grafi viene applicata per ottenere ulteriori approfondimenti sulle relazioni tra test e domini. Test e domini sono stati assegnati ai nodi di una rete, che ha unito i nodi da bordi con lunghezze che rappresentano coefficienti di correlazione rango di Spearman (ρ). La centralità di un nodo indica il numero di bordi adiacenti a quel nodo e la vicinanza a tutti gli altri nodi che è considerata un’indicazione dell’importanza del nodo. La frequenza che un nodo appare sul percorso più breve tra altri due nodi è anche una misura di importanza. L’analisi Minimum Spanning Tree (MST) 28 è utilizzata nel nostro studio come misura affidabile per confrontare le reti tra diversi gruppi poiché è imparziale e non richiede impostazioni arbitrarie dei parametri29. La MST è stata applicata solo di recente alle reti del cervello29 e all’identificazione di geni critici nel diabete mellito30. L’MST è un sotto-grafico che collega tutti i nodi per ridurre la lunghezza totale del bordo. In questo senso, l’MST è la rete “backbone” che incapsula le dipendenze inter-test/dominio. Per misurare la prossimità, usiamo la seguente mappatura per tradurre i coefficienti di correlazione di rango di Spearman (ρ) in distanze.

f f(\rho )=1-\rho,

(1)

or or,f(\rho )=\sqrt{2(1-\rho )}.$ $
(2)

MST di questo grafico è calcolato assegnando i test/domini ai nodi di una rete e unendo i nodi tramite bordi con lunghezze date da ρ.

Panoramica dell’importanza del test/dominio utilizzando le misure di centralità del grafico

La rappresentazione dei test e dei domini in forma di grafico consente la quantificazione delle relazioni tra di essi. Poiché i grafici matematici caratterizzano intrinsecamente le misure di significatività dei nodi, i test / domini assegnati a tali nodi sono considerati altamente rilevanti nella misurazione della CA. Il punteggio di importanza della funzione viene quindi calcolato sull’intero grafico utilizzando misure di centralità popolari come Centralità del grado, Centralità della vicinanza e Between 30. L’Incidenza o la Laurea Centralità di un nodo in un dato grafico conta il numero di spigoli adiacenti il nodo che è matematicamente definito come,

$${C}_{D}(N)={\rm{\deg }}(N)$$
(3)

dove, g := (N, e) è il dato grafico con |N| nodi e |e| bordi. In un grafico connesso, la lunghezza media del percorso più breve tra il nodo e tutti gli altri nodi della rete è indicata come la Centralità di vicinanza normalizzata (o Vicinanza) di un nodo. Pertanto, un alto valore di Vicinanza implica che il nodo sia centrale o significativo. Vicinanza è definito come il reciproco della somma delle distanze da nodo a tutti gli altri nodi, che è,

$${C}_{C}({N}_{1})=\frac{1}{{\sum }_{y}d({N}_{2},{N}_{1})},$$
(4)

dove p(N1, N2) è la distanza tra i vertici N1 e N2. Allo stesso modo, la Between di un nodo calcola la frequenza con cui quel nodo appare tra altri due nodi nel grafico sul percorso più breve. Un alto valore di Betweenness significa che il nodo è rilevante. La Betweenness di un nodo N è indicata come,

$${C}_{B}(N\rangle =\sum _{{N}_{1}\ne N\ne {N}_{2}\in N}\,\frac{{\sigma }_{{N}_{1}{N}_{2}}(N\rangle }{{\sigma }_{{N}_{1}{N}_{2}}},$$
(5)

esperimento di Classificazione

classificazione Binaria

Il passo successivo del programma consta di una diagnosi o di un problema di classificazione binaria confrontando la discriminazione delle prestazioni di ogni singolo test, il combinato 9 test e due ridotti sottoinsiemi utilizzando un Random Forest (RF) classifier31. Ogni caratteristica ha contribuito a ciascuna delle 4 dimensioni Holmeshian a vari livelli (i pesi) che sono stati calcolati di conseguenza per il test 9 complessivo e per il sottoinsieme ottimale di test.

Classificazione multilabel

Nel nostro studio, viene utilizzato un algoritmo adottato basato su foresta casuale per la classificazione Multilabel 32.

L’input di funzionalità nel problema di classificazione multilabel del nostro studio consisteva in 27 componenti principali di tutti i test (3 pezzi x 9 test). L’obiettivo era identificare le disabilità in 5 domini (0: normale; 1: atassico). Per esempio, un partecipante è rappresentato dai domini del discorso, arto superiore, arto inferiore, la deambulazione e l’equilibrio, e l’eventuale etichetta powerset rappresentazione di questo è un multi-classe di classificazione problema con le classi , , , , , , , , …, dove, per esempio, indica un partecipante la cui domini di parola e di arto inferiore sono interessati, mentre i domini dell’arto superiore, la deambulazione e l’equilibrio sono influenzati.

Importanza della caratteristica (o rango) nel modello RF

All’inizio, la dimensione ottimale delle foglie in un classificatore RF viene verificata confrontando gli errori quadrati medi (MSE) ottenuti dalla classificazione per varie dimensioni delle foglie (5, 10, 20, 50 e 100). La dimensione ottimale della foglia dovrebbe produrre i valori MSE più bassi. Una volta che abbiamo stimato la dimensione ottimale delle foglie, un insieme più grande viene coltivato e utilizzato per stimare l’importanza delle caratteristiche. Per calcolare l’importanza della caratteristica nel modello diagnostico della foresta casuale, inizialmente, viene calcolato l’MSE del modello con le variabili originali. Quindi, i valori di una singola colonna (che rappresenta la caratteristica 1 per n osservazioni) vengono permutati e l’MSE viene nuovamente calcolato. Ad esempio, se una colonna prende i valori delle funzionalità x1, x2, x3, x4 e una permutazione casuale dei valori risulta in x4, x3, x1, x2; allora questo si tradurrà in un nuovo MSE. La differenza di MSE viene calcolata in media su tutti gli alberi dell’insieme e divisa per la deviazione standard rilevata sugli alberi per ciascuna variabile. Maggiore è questo valore, più significativa è la variabile. La differenza dovrebbe essere positiva, ma se si tratta di un numero negativo, implica che la permutazione casuale ha funzionato meglio deducendo che la caratteristica non ha un ruolo nella previsione e non è ritenuta importante.

Calcolo delle STELLE

Una volta valutata l’importanza / il rango delle 3 caratteristiche del PC per un test specifico attraverso lo schema di classificazione casuale della foresta, il peso della caratteristica originale viene calcolato come segue:

feature feature\_weights=WOF\_InPC{1}^{\ast }R\_PC1+WOF\_InPC{2}^{\ast }R\_PC2+WOF\_InPC{3}^{\ast }R\_PC3, where
(6)

dove WOF: Peso di questa funzione in un componente PC; R: Rango della funzione PC nel modello RF. Poiché ogni caratteristica si riferisce ad una delle 4 dimensioni Holmeshian, il contributo della stabilità complessiva, Timing, Precisione e Ritmicità dimensione è il weigtage accumulato di tutte le caratteristiche di stabilità, Tempismo, Precisione e ritmicità rispettivamente.

Cross validation (CV)

Per entrambi i problemi di classificazione, i dati vengono stratificati utilizzando una tecnica CV Leave-one-out (LOO). La convalida incrociata nelle impostazioni multilabel è complicata dal fatto che il metodo ordinario (binario/multiclasse) di campionamento stratificato non è applicabile; metodi alternativi di campionamento stratificato approssimativo sono stati suggeriti in33. Quindi, nel nostro studio, la stratificazione multi-etichetta è stata eseguita utilizzando una tecnica iterativa.

Metriche di valutazione

Le prestazioni del classificatore vengono valutate utilizzando metriche, Precisione, Richiamo, punteggio F1, Precisione e coefficiente di correlazione Matthews (MCC)34. Queste metriche vengono calcolate per ogni dominio in base ai valori previsti dopo ogni convalida in LOO (34 volte). Precisione generale, richiamo, punteggio F1, Accuratezza del problema di classificazione multilabel sono la media dei risultati attraverso LOO nei 5 domini. Ad esempio,

general general\_precision=sum(precision\_values\_in\_5\_domains)/5.$ $
(7)

Feature ranking attraverso un treno RF& la validazione con LOO è la media di tutti i rank in ogni fase di allenamento e validazione, sia per i problemi di classificazione binaria che multilabel.