Évaluation objective de l’Ataxie cérébelleuse: Une Approche complète et Raffinée
Système d’évaluation objective complète (COA)
Dans cette étude, nous avons utilisé BioKin17, une plate-forme de capteurs à capture de mouvement en temps réel basée sur le cloud pour effectuer une évaluation objective complète de l’AC. BioKin17 est un appareil portable sans fil avec un accéléromètre tri-axial intégré (chipset modèle « MPU-9150 » d’InvenSense, Inc., San Jose, CA, États-Unis) et un IEEE802.interface de communication sans fil 11b / g / n/ fonctionnant sur un processeur ARM 32 bits. Le système de capteurs BioKin développé par Networked Sensing and Control Lab, de l’Université Deakin, peut interagir avec une application mobile Android pour capturer des mouvements complexes d’un corps humain en temps réel, comme illustré à la Fig. 1. Il est optimisé pour réduire les effets de décantation et les problèmes de dérive des capteurs en éliminant les erreurs d’alignement des axes transversaux au niveau de la carte entre chaque capteur inertiel17. Ce capteur a été marqué sur banc par rapport à un système de suivi de mouvement optique classique à caméras multiples (système Vicon, T40S, Oxford, Royaume-Uni), un système de marquage sur banc de haute précision18. BioKin a capturé les données du gyroscope et de l’accélération en coordonnées cartésiennes tridimensionnelles (3D) à une fréquence d’échantillonnage de 50 Hz. L’évaluation de l’AC a été réalisée à travers les étapes suivantes:
-
Entrées de mouvement générées par neuf tests instrumentés qui imitent les neuf tests cliniques standard de l’AC au chevet du patient couvrant les 5 domaines.
-
Ceux-ci sont capturés par des capteurs et visualisés avec une application de support dans un smartphone.
-
Transmission sans fil vers un réseau de cloud distribué basé sur une blockchain 19 où des algorithmes de diagnostic et d’évaluation sont appliqués.
-
Les résultats de l’analyse des données sont transformés en un format cliniquement pertinent.
Une représentation picturale de la plate-forme de capteurs est illustrée à la Fig. 1.
Entrée de mouvement
Les sujets ont été amenés à effectuer neuf tests cliniques standard; énoncé syllabique répété (SPE), tapotement rythmique des doigts (nageoire), doigt-nez / nez-doigt (FNT), dysdiadochokinésie (DDK), suivi balistique / poursuite des doigts (BAL), talon-tibia (HST), tapotement des pieds (FOO), position / romberg (ROM) et démarche (WAL). Les tâches sont effectuées en ligne avec les instructions spécifiées dans la SARA qui couvrent tous les 5 domaines. Pour éviter tout facteur de confusion dû au balancement lors de l’exécution des tests en position assise, les participants ont reçu un soutien axial, c’est-à-dire assis confortablement dans une position assise verticale. Le support du dossier de la chaise était incliné à 90-100 degrés avec un support de bois adéquat en ligne avec le bas du dos. Les membres droit et gauche ont été évalués.
Acquisition de données
Le système COA a utilisé des unités de mesure inertielles (IMU) équipées du système BioKin dans sept des tests pour capturer la cinématique de translation et de rotation dans des axes orthogonaux via des accéléromètres et des gyroscopes. Une caméra Microsoft Kinect V2 équipée d’un moniteur de 23 pouces et un mini PC avec un processeur Intel core i5 ont également été utilisés dans l’un des tests pour la capture de mouvement basée sur le marqueur et pour obtenir les informations de position absolues.
Algorithmes basés sur le cloud
Les données enregistrées sont ensuite transférées vers le réseau de cloud distribué basé sur la blockchain 19 via la connexion sans fil pour un traitement ultérieur des données permettant aux médecins d’acquérir des scores de gravité. Les environnements MATLAB (R2019a, MathWorks) et Python traitaient les données transmises par des moyens sans fil.
Sortie clinique
Les données capturées sont visualisées via l’application pour téléphone intelligent basée sur Android, BioKin, qui génère des rapports d’évaluation et des scores de gravité à la suite du traitement des données basé sur le cloud.
Dans notre système COA, la dépense temporelle moyenne dans l’acquisition des données par capture de mouvement à partir de chacun des 6 tests périphériques (DDK, FNT, FIN, BAL, FOO, HST) est inférieure à 15 secondes. Le test d’équilibre (ROM) prend moins de 30 secondes; le test de marche (WAL) prend moins de 90 secondes tandis que le test de parole (SPE) prend moins de 5 secondes pour acquérir des données. Par conséquent, la dépense temporelle moyenne pour acquérir des données et générer un résultat de test cumulatif (en utilisant des algorithmes basés sur le cloud) pour un seul patient est d’environ moins de 215 secondes et 5 secondes respectivement. Le jeu de tests prend généralement jusqu’à 30 secondes.
Conception expérimentale
Participants
Pour une analyse approfondie des anomalies attribuées au timing, à la stabilité, à la précision et à la rythmicité des mouvements moteurs, des données de parole et de cinématique ont été enregistrées auprès de 34 sujets dont la langue maternelle était l’anglais. Vingt-trois ont déjà reçu un diagnostic d’Ataxie cérébelleuse (CA) due à un trouble neurodégénératif et ont fréquenté la clinique de neurologie du Royal Victorian Eye and Ear Hospital (RVEEH) ou de l’hôpital Alfred à Melbourne. Onze sujets normaux (témoins) étaient des volontaires sans antécédents de troubles neurologiques ou d’autres troubles de la parole. Le tableau 1 présente un résumé des statistiques de la cohorte. Aucun des participants (témoins et AC) n’avait suivi de programme de réadaptation avant cette enquête clinique. Aucun des participants (témoins et AC) n’avait suivi de programme de réadaptation avant cette enquête clinique. Un examen de la littérature20, 21, 22 a révélé que l’âge d’apparition, l’âge du diagnostic et d’autres facteurs démographiques n’influencent pas l’âge et les ogm liés à l’ataxie. Comme notre étude était limitée à une cohorte d’ataxie à l’âge adulte, le respect strict des critères de correspondance entre l’âge et le sexe n’était pas réalisable.
Approbation éthique et consentement à participer
Cette étude a été approuvée par le Comité de recherche et d’éthique sur l’homme, Royal Victorian Eye and Ear Hospital, East Melbourne, Australie (Numéro de référence HREC: 11 / 994H / 16) et soutenue par le Florey Institute of Neuroscience and Mental Health, Melbourne, Australie par le biais de la subvention du National Health and Medical Research Council (NHMRC): GNT1101304 et APP1129595. Toutes les méthodes de cette étude ont été effectuées conformément aux directives et règlements pertinents et le consentement écrit a été obtenu de tous les participants avant leur inscription. Le consentement éclairé a été obtenu des deux sujets pour publier les images représentées sur la Fig. 1.
Protocole de test et extraction de caractéristiques
Les évaluations objectives des neuf tests neurologiques sont regroupées dans les 5 domaines suivants avec une brève description de leur protocole d’exécution. Un résumé des caractéristiques qui se sont révélées cruciales dans le diagnostic de l’AC dans l’étude respective4,6,7,8,9,10,11 a également été inclus pour chaque sous-section d’essai dans le tableau 2.
Discours
-
Énoncé de syllabe répété (SPE): Le candidat devait répéter la syllabe consonne-voyelle /ta/ pendant 5 secondes à sa vitesse préférée. Les enregistrements ont été réalisés à l’aide d’un microphone à condensateur coupé à une distance approximative de 10 cm de la bouche du sujet dans une pièce calme avec un faible niveau de bruit ambiant. Un téléphone Android utilisant le programme BioKinMobi sous la supervision d’un enquêteur professionnel a capturé le discours. Un algorithme automatisé basé sur la proéminence topographique a été utilisé pour extraire six caractéristiques acoustiques du train d’énoncés répétés /ta/syllabes4,6.
-
La régularité de la durée mesure la variabilité du rythme de l’énoncé répété /ta/(RT). Ceci est identifié comme une mesure intégrale des déficits temporels extraits des données sur les vagues à une proéminence de 50%.
-
La régularité de l’écart mesure la variabilité de la différence de temps entre deux pics consécutifs /ta/syllabe.
-
La proéminence moyenne du pic a mesuré l’élévation/le pic relatif moyen pour une impulsion spécifique/ta/considérée.
-
La régularité de la compensation a mesuré la variabilité des différences calculées entre le pic et sa proéminence correspondante pour une impulsion spécifique /ta/syllabique.
-
Le rapport d’amortissement a mesuré la moyenne des rapports d’amortissement /ta/syllabes calculés à partir des données d’onde extraites à 75% de proéminence.
-
La fréquence de résonance a mesuré la moyenne de la fréquence de résonance des /ta/syllabes calculée sur les données d’onde extraites à 50% de proéminence.
Membre supérieur
-
Test de tapotement rythmique des doigts (AILERON): Les participants tapaient rythmiquement leur index contre une surface horizontale (par exemple, un plateau de table) à leur vitesse et durée préférées. Une biokine a été montée sur le dos de l’index pointant pour l’acquisition de données. Les 3 premières Composantes principales (PC) de l’entropie multi-échelles mesurées à partir des axes X et Z des signaux de l’accéléromètre et de l’axe X des signaux du gyroscope et le coefficient de variation de l’intervalle inter-prises mesurant l’irrégularité du rythme ont été les caractéristiques sélectionnées7.
-
Test doigt-nez (FNT): Les participants devaient toucher leur nez avec leur index pointu, puis, à l’aide du même doigt, tendre la main et toucher le doigt du clinicien placé à environ 25 cm du nez du sujet. Les mouvements de la main ont été mesurés par une biokine attachée au dos de la main de l’index pointé. La fréquence de résonance et l’amplitude à la fréquence de résonance étaient les caractéristiques critiques8 capturées par la biokine attachée à la paume de l’index. La description du domaine fréquentiel de l’accélération et de la vitesse angulaire a été utilisée pour capturer la résonance dans chaque axe orthogonal (X, Y et Z)8.
-
Test de Dysdiadochokinésie (DDK): Les participants devaient placer le dos d’une main sur la paume de l’autre main, comme illustré à la Fig. 1. Les participants ont ensuite été invités à proner leur main, de sorte que le côté de la paume soit orienté vers le bas pour reposer sur la paume de l’autre main. Le sujet est également chargé de proner et de supiner alternativement entre ces deux positions aussi rapidement et précisément que possible. Le taux d’alternance est extrait de l’IMU de la Biokine attachée au poignet. Ce test a examiné l’incapacité de coordonner les mouvements. La vitesse d’altération du pronate et du supinate, la fréquence de résonance et l’amplitude à la fréquence de résonance étaient les caractéristiques critiques.8
-
Suivi balistique (BAL) : Les participants devaient pointer vers la cible sur un écran de surveillance. Le mouvement de l’index pointé a été détecté à l’aide de la caméra Kinect et a été présenté comme un marqueur à l’écran. L’objectif est de suivre avec précision la cible via le marqueur projeté (avec la caméra Kinect) sur l’écran lorsque la cible se déplace rapidement et de manière aléatoire d’un point à l’autre sur le moniteur. Les caractéristiques extraites suivantes ont montré un niveau significatif de corrélation avec le niveau d’invalidité capturé par la mesure clinique standard SARA9:
-
Erreur: La distance entre les trajectoires du marqueur et de la cible, mesurée à l’aide de la méthode de Déformation temporelle dynamique dans l’axe horizontal (H) et Vertical (V).
-
Délai complet: Cela a été calculé comme la corrélation croisée pour la séquence à deux temps, le marqueur et la cible.
-
Retard cinématique: Ceci a été obtenu en utilisant l’indice de mesure de la performance dans la loi de Fitts. La fonction consiste à mesurer les performances du sujet pour atteindre une position cible.
-
Changement de direction dans les axes H et V: C’est le nombre de fois où le participant a modifié son accélération qui a été mesuré en termes de changement de direction. Cette fonctionnalité contenait des informations de sur / sous-tir ainsi que les performances du sujet pendant le test. Un niveau plus élevé de dysmétrie a déduit un taux d’erreur plus élevé selon la différence entre les trajectoires de la cible et du marqueur.
Membre inférieur
-
Test Talon-tibia (HST): Les participants devaient placer un talon sur le genou opposé et le courir le long du tibia, entre le talon et le genou de manière répétitive et aussi précise que possible. La biokine était attachée au dos du pied. La fréquence de résonance et l’amplitude à la fréquence de résonance étaient les caractéristiques critiques8.
-
Tapotement rythmique des pieds (FOO): Les participants devaient taper rythmiquement chaque pied contre une surface horizontale (par exemple, le sol). Les 3 premières Composantes principales (PC) de l’entropie multi-échelle mesurée à partir des axes X et Z des signaux de l’accéléromètre et de l’axe X des signaux du gyroscope, ainsi que le coefficient de variation de l’intervalle inter-prises mesurant l’irrégularité du rythme ont été les caractéristiques sélectionnées7.
Balance
-
Test de Romberg (ROM): Les participants devaient rester debout les pieds ensemble puis les pieds écartés, les bras sur les côtés le plus longtemps possible (jusqu’à 30 secondes); d’abord les yeux ouverts, puis les yeux fermés. Une biokine a été positionnée approximativement sur le xiphisternum au moyen d’une ceinture élastique en néoprène. La deuxième Biokine était fixée sur le haut du dos, dans la ligne médiane juste en dessous du cou. La technique de l’entropie floue a été utilisée sur la vitesse de balancement postural déduite des accélérations tronquées mesurées. Les valeurs d’entropie23 de la vitesse déduite ont été considérées principalement comme une mesure du contrôle du moteur neural pendant une posture debout silencieuse dont une partie significative est proportionnelle à la vitesse de balancement du corps. L’incertitude dans la mesure de la vitesse contenait un niveau significatif d’information en ce qui concerne l’instabilité tronque10.
Marche
-
Test de marche (WAL): Les participants devaient marcher 5 mètres et revenir, ce qui était répété 10 fois. Les mouvements du sujet ont été captés par les capteurs inertiels intégrés d’un smartphone fixé au xiphisternum au moyen d’une ceinture élastique en néoprène et de deux capteurs BioKin, fixés à chaque cheville. Le capteur a été positionné de telle sorte que ses axes X, Y et Z capturent les mouvements ML (Médio-Latéraux), AP (Antéro-Postérieur) et VT (Axe Vertical) respectivement. Dans chaque axe orthogonal (X, Y et Z), la description du domaine fréquentiel a été utilisée pour capturer la résonance11. Pour chaque sujet, la magnitude et la résonance ont été utilisées dans chaque axe pour former un vecteur caractéristique. Une autre caractéristique, la mesure d’irrégularité de vitesse basée sur l’entropie floue pour l’anomalie tronconique (VI) a été choisie dans l’étude11 pour mesurer le caractère aléatoire de la démarche ou le niveau d’incertitude pendant la marche. L’étude in23 a introduit l’entropie floue (floue) pour capturer l’ataxie tronconique.
En référence à la cohorte ataxique inscrite dans notre étude, pour ceux qui ont un score SARA 7 pour la marche – dans le cas où une aide à la marche est requise, le patient est invité à effectuer le test à l’aide de l’aide à la marche appropriée (c’est-à-dire un bâton à point unique ou un cadre à quatre roues (4WF)).
Dimensions ataxiques (ÉTOILE)
Les travaux de Gordon Holmes sont souvent cités comme ayant une influence fondamentale sur notre compréhension des symptômes cliniques et des signes des lésions cérébelleuses2,3,24. Dans notre étude, nous avons revisité l’approche de Holmes consistant à caractériser le mouvement des sujets présentant un dysfonctionnement cérébelleux en termes de quatre dimensions (Stabilité, Synchronisation, Précision & Rythmicité).
-
Stabilité(S) : Ceci concerne la stabilité de la plate-forme (d’exécution). La plate-forme est constituée des articulations et des muscles qui sont relativement fixes et permettent à la partie du corps en mouvement d’exécuter une tâche avec précision. Par exemple, la tâche DDK nécessite une stabilité relative de la flexion et de l’extension de l’épaule et du coude pour une exécution efficace. L’instabilité relative entraîne une augmentation des mouvements inutiles dans les axes secondaires.
-
Timing(T): Lorsque CA est présent, les tâches qui ont une contrainte de temps, comme BAL, ont généralement une latence accrue avant le début du mouvement et la tâche est exécutée à une vitesse plus lente, car un cours moins direct est suivi. Les mêmes caractéristiques sont souvent apparentes même en l’absence de contraintes de temps. Ces caractéristiques sont plus apparentes lorsque l’AC est plus sévère, ce qui suggère que, inconsciemment, le timing est un compromis neutre pour terminer la tâche. En termes de calcul, nous l’avons reconnu comme l’erreur entre l’objectif et ce qui est atteint, susceptible d’être impacté par les deux suivants:
-
Temps pour que le sujet initie un moment.
-
Temps pour terminer un mouvement (vitesse).
-
Précision (A): Conceptuellement, une tâche peut être accomplie lentement mais suivre la cible la plus efficace. Dans ces circonstances, nous considérerons qu’il s’agit d’une performance ”précise ». Lorsqu’un chemin moins direct est suivi (par exemple dans la tâche BAL) ou qu’il y a un tournage inférieur ou supérieur, alors la tâche sera des « erreurs » par rapport à une performance de contrôle (en reconnaissant que cela peut également être associé à des erreurs de timing). En termes de calcul, dans cette étude, nous le reconnaissons comme une erreur entre les objectifs objectif / espace par rapport à ce qui est atteint dans un contexte spatial (statique).
-
Rythmicité (R) : Irrégularité dans les mouvements répétés.
-
Les caractéristiques de chaque test dans notre système COA proposé sont attribuées aux dimensions susmentionnées par l’approche en 2 étapes suivante:
-
(a) L’axe d’exécution est la direction du mouvement primaire requis pour exécuter la tâche prévue et serait attribué à la dimension de rythmicité ou de synchronisation.
(b) Tout écart par rapport au chemin le plus efficace ou au chemin standard requis pour exécuter la tâche serait considéré comme des caractéristiques de précision.
-
Des mouvements excessifs dans les autres axes seraient considérés comme des mouvements secondaires et attribuables à la dimension de stabilité.
Une représentation picturale de la Fig. 2 illustre l’interprétation des ÉTOILES pour chaque domaine, selon l’approche en 2 étapes proposée.
Critères d’étiquetage des étoiles.
Dans les tests répétitifs (DDK, FNT, FIN, FOO, HST), la fréquence de résonance le long de l’axe des ordonnées (primaire) contribue à la vitesse et est donc considérée comme une caractéristique temporelle alors que l’amplitude de la résonance est considérée comme une caractéristique rythmique. Les mouvements/ perturbations secondaires présents dans d’autres axes sont appelés caractéristiques de stabilité.
Pour les tests basés sur la cible (BAL), tout retard dans le mouvement primaire de poursuite de la cible est considéré comme une caractéristique de synchronisation; la mesure dans laquelle une cible est atteinte ou tout degré d’écart dans l’atteinte de la cible définit la performance du participant et mesure donc la précision; toute autre caractéristique liée à des mouvements excessifs / inefficaces est marquée sous stabilité.
Le test de démarche consiste à avancer en ligne droite (le long de l’axe AP) à un rythme régulier en soulevant et en posant chaque pied de manière rythmique. Cela déduiserait des informations de rythmicité tandis que l’étendue du balancement tronqué de l’axe AP (c’est-à-dire le mouvement dans l’axe ML) déduisera des informations de précision. De plus, tout balancement indésirable dans l’axe VT est considéré comme une caractéristique de stabilité.
Pour le test d’équilibre, un participant doit maintenir une posture droite régulière le long de son axe VT. Ceci étant leur mouvement principal, toute déviation ou balancement dans l’axe VT expliquera l’inexactitude et tout autre balancement tronconique indésirable dans AP ou ML est considéré comme des caractéristiques de stabilité.
Pour le test de la parole, les caractéristiques mesurant la nature rythmique des énoncés /ta/ répétés, par exemple l’écart entre les énoncés /ta / consécutifs, la durée de a / ta/ sont considérées comme des caractéristiques de rythmicité et la caractéristique de fréquence de résonance comme une caractéristique de synchronisation. Un rapport d’amortissement inférieur indique une oscillation plus élevée. Par conséquent, le rapport d’amortissement inférieur de a / ta / énoncé, en tant que caractéristique acoustique ataxique, indique une instabilité du tractus vocal lors de l’articulation de la voix.
Un résumé des neuf tests dans 5 domaines, générant 172 caractéristiques est présenté avec leur interprétation en ÉTOILE dans le tableau 2.
Évaluation clinique
L’AC a été notée par un clinicien expérimenté selon l’échelle SARA, tandis que les sujets atteints d’ataxie effectuaient chaque tâche. SARA est une échelle clinique développée par Schmitz-Hübsch et al.25,26 qui évalue une gamme de déficiences différentes dans l’ataxie cérébelleuse, allant de la parole à l’équilibre. L’échelle est composée de 8 catégories avec des scores allant de, démarche (0-8 points), position (0-6 points), assise (0-4 points), troubles de la parole (0-6 points), poursuite des doigts (0-4 points), test nez-doigt (0-4 points), mouvement alternatif rapide de la main (0-4 points), glissement talon-tibia (0-4 points). Une fois que le clinicien a évalué chacune des 8 catégories pour un individu, il peut calculer davantage le score cumulatif allant de 0 (pas d’ataxie) à 40 (ataxie la plus sévère) pour déterminer la gravité de l’ataxie du sujet ataxique. Dans notre étude, pour éviter tout biais subjectif, un clinicien a évalué toutes les tâches.
Schéma d’évaluation à 3 niveaux du système COA
Les techniques à incorporer dans le système instrumenté proposé (système COA) sont démontrées au moyen d’un organigramme (Fig. 3) et décrites dans les sous-sections suivantes.
Réduction des caractéristiques et analyse statistique
L’extraction des caractéristiques d’origine pour chaque test était basée sur des études antérieures pertinentes4,6,7,8,9,10,11. Au total, 172 caractéristiques ont été identifiées comme critiques pour une évaluation objective des tests individuels. Les mesures de processus contiennent de nombreuses données corrélées ou redondantes. Il est important de les supprimer et d’extraire les fonctionnalités qui ont la pertinence la plus indépendante. L’analyse en composantes principales (APC) 27 est un outil de compression, d’extraction et de visualisation de données utilisé pour transformer plusieurs facteurs associés en un groupe de variables non corrélées. Le PCA est utilisé pour compresser les 172 fonctionnalités d’origine en 27 PC (3 PC de chacun des 9 tests) (Fig. 3). De plus, les informations critiques ne proviennent pas d’une seule variable d’un test individuel, mais proviennent souvent de la relation entre les variables, c’est-à-dire de la façon dont elles co-varient. L’APC est la méthode statistique multivariée la plus appropriée parmi les méthodes couramment utilisées pour évaluer de telles informations, car elle peut gérer un grand nombre de facteurs fortement corrélés, bruyants et redondants.
La valeur p pour le test d’hypothèse est calculée pour les distributions des 3 PCs résultantes (PCs 1-2-3) de chaque test par rapport à chacun des 5 domaines (Parole, membre supérieur, membre inférieur, démarche, équilibre) pour déterminer si les groupes de sujets (contrôle et ataxique) diffèrent significativement. Dans chaque domaine, les individus dont les mesures de la LEP sont supérieures à zéro sont regroupés comme ataxiques, et les témoins et les sujets ayant obtenu un score de la LEP de 0 pour un test particulier sont regroupés comme normaux. Des tests statistiques non paramétriques (Kolmogorovâ € » Smirnov (KS) et Mann-Whitney-Wilcoxon (MWW)) sont adoptés pour éviter les hypothèses sur la distribution des données.
Théorie des graphes &mesures de centralité
Quantification visuelle des dépendances test/domaine
La théorie des graphes est appliquée pour obtenir des informations supplémentaires sur les relations entre les tests et les domaines. Les tests et les domaines ont été assignés aux nœuds d’un réseau, qui ont joint les nœuds par des arêtes avec des longueurs représentant les coefficients de corrélation de rang de Spearman (ρ). La centralité d’un nœud indique le nombre d’arêtes adjacentes à ce nœud et la proximité de tous les autres nœuds, ce qui est considéré comme une indication de l’importance du nœud. La fréquence à laquelle un nœud apparaît sur le chemin le plus court entre deux autres nœuds est également une mesure d’importance. L’analyse MST (Minimum Spanning Tree)28 est utilisée dans notre étude comme mesure fiable pour comparer les réseaux entre différents groupes, car elle est impartiale et ne nécessite pas de paramètres arbitraires29. Le MST n’a été appliqué que récemment aux réseaux cérébraux29 et à l’identification de gènes critiques dans le diabète mellitus30. Le MST est un sous-graphique qui relie tous les nœuds pour réduire la longueur totale des arêtes. En ce sens, le MST est le réseau « backbone » qui encapsule les dépendances inter-test/domaine. Pour mesurer la proximité, nous utilisons la cartographie suivante pour traduire les coefficients de corrélation de rang de Spearman (ρ) en distances.
Le MST de ce graphique est calculé en attribuant les tests/domaines aux nœuds d’un réseau et en joignant les nœuds via des arêtes de longueurs données par ρ.
Aperçu de l’importance du test/domaine à l’aide de mesures de centralité graphique
La représentation des tests et des domaines sous forme de graphique permet de quantifier les relations entre eux. Étant donné que les graphes mathématiques caractérisent intrinsèquement les mesures de signification des nœuds, les tests / domaines attribués à ces nœuds sont considérés comme très pertinents pour mesurer l’AC. Le score d’importance de la caractéristique est ensuite calculé sur l’ensemble du graphique à l’aide de mesures de Centralité populaires telles que la Centralité du Degré, la Centralité de la Proximité et l’Entrée30. L’incidence ou la centralité de degré d’un nœud dans un graphe donné compte le nombre d’arêtes adjacentes à ce nœud qui est défini mathématiquement comme,
où, g:=(N, e) est le graphe donné avec |N|nœuds et |e|arêtes. Dans un graphe connecté, la longueur moyenne du chemin le plus court entre le nœud et tous les autres nœuds du réseau est désignée comme la centralité de proximité normalisée (ou Proximité) d’un nœud. Par conséquent, une valeur de proximité élevée implique que le nœud est central ou significatif. La proximité est définie comme l’inverse de la somme des distances entre le nœud et tous les autres nœuds, c’est-à-dire
où d(N1, N2) est la distance entre les sommets N1 et N2. De même, l’entrecroisement d’un nœud calcule la fréquence à laquelle ce nœud apparaît entre deux autres nœuds du graphique sur le chemin le plus court. Une valeur élevée d’Entregent signifie que le nœud est pertinent. L’interstitialité d’un nœud N est notée,
Expérience de classification
Classification binaire
L’étape suivante du schéma consiste en un diagnostic ou un problème de classification binaire comparant les performances de discrimination de chacun des tests individuels, du test combiné 9 et de deux sous-ensembles réduits en utilisant un classificateur de forêt aléatoire (RF)31. Chaque caractéristique a contribué à chacune des 4 dimensions Holmeshiennes à des degrés divers (les poids) qui ont été calculés en conséquence pour le test global 9 ainsi que pour le sous-ensemble optimal des tests.
Classification Multilabel
Dans notre étude, un algorithme adopté basé sur une forêt aléatoire pour la classification Multilabel 32 est utilisé.
L’entrée de caractéristique dans le problème de classification multi-étiquettes de notre étude consistait en 27 composants principaux de tous les tests (3 PCs x 9 tests). L’objectif était d’identifier les handicaps dans 5 domaines (0: normal; 1: ataxique). Par exemple, un participant est représenté par les domaines de la parole, du membre supérieur, du membre inférieur, de la démarche et de l’équilibre; et la représentation possible de l’ensemble de puissance d’étiquette de ceci est un problème de classification multi-classes avec les classes , , , , , , , , …, où, par exemple, désigne un participant dont les domaines de la parole et du membre inférieur sont affectés alors que les domaines du membre supérieur, de la démarche et de l’équilibre ne sont pas affectés.
Importance de la caractéristique (ou rang) dans le modèle RF
Au tout début, la taille optimale des feuilles dans un classificateur RF est vérifiée en comparant les erreurs quadratiques moyennes (MSE) obtenues par classification pour différentes tailles de feuilles (5, 10, 20, 50 et 100). La taille optimale des feuilles devrait donner les valeurs MSE les plus faibles. Une fois que nous avons estimé la taille optimale des feuilles, un ensemble plus grand est cultivé et utilisé pour estimer l’importance des caractéristiques. Pour calculer l’importance de la caractéristique dans le modèle de diagnostic de forêt aléatoire, initialement, le MSE du modèle avec les variables d’origine est calculé. Ensuite, les valeurs d’une seule colonne (représentant la caractéristique 1 pour n observations) sont permutées et le MSE est à nouveau calculé. Par exemple, si une colonne prend les valeurs d’entités x1, x2, x3, x4 et qu’une permutation aléatoire des valeurs entraîne x4, x3, x1, x2; alors cela se traduira par un nouveau MSE. La différence de MSE est moyennée sur tous les arbres de l’ensemble et divisée par l’écart-type pris sur les arbres pour chaque variable. Plus cette valeur est grande, plus la variable est significative. On s’attend à ce que la différence soit positive, mais s’il s’agit d’un nombre négatif, cela implique que la permutation aléatoire a mieux fonctionné en déduisant que la caractéristique n’a pas de rôle dans la prédiction et n’est pas jugée importante.
Calcul des étoiles
Une fois que l’importance/le rang des 3 entités PC est évalué pour un test spécifique via le schéma de classement aléatoire des forêts, le poids de l’entité d’origine est calculé comme suit:
où WOF: Poids de cette fonctionnalité dans un composant PC; R: Rang de la fonction PC dans le modèle RF. Puisque chaque caractéristique se rapporte à l’une des 4 dimensions Holmeshiennes, la contribution de la dimension globale de Stabilité, de Synchronisation, de Précision et de Rythmicité est le poids cumulé de toutes les caractéristiques de Stabilité, de Synchronisation, de Précision et de Rythmicité respectivement.
Validation croisée (CV)
Pour les deux problèmes de classification, les données sont stratifiées à l’aide d’une technique de CV sans sortie (LOO). La validation croisée dans les paramètres à étiquettes multiples est compliquée par le fait que la méthode ordinaire (binaire/multiclasse) d’échantillonnage stratifié n’est pas applicable; d’autres méthodes d’échantillonnage stratifié approximatif ont été suggérées dans33. Ainsi, dans notre étude, la stratification multi-étiquettes a été réalisée en utilisant une technique itérative.
Métriques d’évaluation
Les performances du classificateur sont évaluées à l’aide des métriques, de la Précision, du Rappel, du score F1, de la Précision et du Coefficient de corrélation de Matthews (MCC) 34. Ces métriques sont calculées pour chaque domaine en fonction des valeurs prédites après chaque validation en LOO (34 fois). Précision générale, rappel, score F1, Précision du problème de classification multi-étiquettes sont la moyenne des résultats par LOO dans les 5 domaines. Par exemple,
Classement des entités par un train RF &la validation avec LOO est la moyenne de tous les classements dans chaque phase d’entraînement et de validation, pour les problèmes de classification binaires et multilabel.
Leave a Reply