Articles

Objective Assessment of cerebellaire Ataxia: A Comprehensive and verfijnd Approach

Comprehensive objective assessment (COA) system

In deze studie gebruikten we BioKin17, een cloud based real time motion capture sensor platform om een comprehensive objective assessment van CA. BioKin17 is een draadloos draagbaar apparaat met een ingebouwde tri-axiale versnellingsmeter (model chipset “MPU-9150” van InvenSense, Inc., San Jose, CA, USA) en een IEEE802.11b/g/n / draadloze communicatie-interface die draait op een 32-bits ARM processor. Het biokin-sensorsysteem dat is ontwikkeld door Networked Sensing and Control Lab, Deakin University, kan interageren met een mobiele Android-applicatie om complexe bewegingen van een menselijk lichaam in real-time vast te leggen, zoals in Fig. 1. Het is geoptimaliseerd voor het verminderen van bezinkingseffecten en sensordrift problemen door het elimineren van board-level cross-axis uitlijnfouten tussen elke traagheidssensor17. Deze sensor werd op een bank gemarkeerd met een conventioneel optisch motion tracking systeem (Vicon system, T40S, Oxford, UK), een zeer nauwkeurig bench marking systeem18. BioKin registreerde de gyroscoop – en versnellingsgegevens in de driedimensionale (3D) Cartesiaanse coördinaten met een bemonsteringssnelheid van 50 Hz. De CA-beoordeling werd uitgevoerd door middel van de volgende stappen:

  1. Bewegingsinput gegenereerd door negen geïnstrumenteerde tests die de negen standaard klinische tests naast het bed van CA voor de 5 domeinen nabootsen.

  2. Deze worden vastgelegd door sensoren en gevisualiseerd met een ondersteunende toepassing in een smartphone.

  3. draadloze transmissie naar een op blockchain gebaseerd gedistribueerd cloudnetwerk19 waar diagnostische en beoordelingsalgoritmen worden toegepast.

  4. resultaten van de gegevensanalyse worden omgezet in een klinisch relevant formaat.

in Fig. 1.

Bewegingsinvoer

proefpersonen werden gemaakt om negen standaard klinische tests uit te voeren; herhaalde lettergrepen( SPE), ritmisch tikken met de vinger (FIN), vingerneus/neusvinger (FNT), dysdiadochokinesie (DDK), ballistisch volgen/Vingeren (BAL), hiel-scheenbeen (HST), voettappen (FOO), stance/romberg (ROM) en gang (WAL). De taken worden uitgevoerd in lijn met de instructies gespecificeerd in SARA die betrekking hebben op alle 5 domeinen. Om verstorende factoren als gevolg van slingeren tijdens het uitvoeren van de tests in de zittende positie te voorkomen, kregen de deelnemers axiale ondersteuning, dat wil zeggen comfortabel zitten in een rechtop zittende positie. De rugleuning van de stoel was gebogen op 90-100 graden met voldoende hout ondersteuning in lijn met de onderrug. Zowel de rechter als de linker ledematen werden beoordeeld.

gegevensverzameling

het COA-systeem gebruikte inertiële meeteenheden (IMU ‘ s) die in het BioKin-systeem zijn uitgerust bij zeven van de tests om translationele en rotatiekinematica in orthogonale assen vast te leggen via accelerometers en gyroscopen. Een Microsoft Kinect v2 camera uitgerust met een 23 inch monitor, en mini PC met een Intel core i5 processor werd ook gebruikt in een van de tests voor de marker gebaseerde motion capture en om de absolute positie informatie te verkrijgen.

cloudgebaseerde algoritmen

de opgenomen gegevens worden vervolgens via de draadloze verbinding overgebracht naar het blockchaingebaseerde gedistribueerde cloudnetwork19 voor verdere gegevensverwerking, zodat artsen ernstscores kunnen verkrijgen. MATLAB (R2019a, MathWorks) en Python omgevingen verwerkt de gegevens verzonden via draadloze middelen.

klinische output

de vastgelegde gegevens worden gevisualiseerd via de android-applicatie voor smartphones, BioKin, die evaluatierapporten en ernstscores genereert als gevolg van de gegevensverwerking in de cloud.

in ons COA-systeem zijn de gemiddelde tijdsuitgaven voor het verkrijgen van de gegevens via motion capture van elk van de 6 perifere tests (DDK, FNT, FIN, BAL, FOO, HST) minder dan 15 seconden. De balans test(ROM) duurt minder dan 30 seconden; de gang test (WAL) duurt minder dan 90 seconden, terwijl de spraak test (SPE) duurt minder dan 5 seconden om gegevens te verkrijgen. Vandaar dat de gemiddelde tijdsuitgaven voor het verkrijgen van gegevens en het genereren van een cumulatief testresultaat (met behulp van cloud-gebaseerde algoritmen) voor een enkele patiënt respectievelijk ongeveer onder 215 seconden en 5 seconden zijn. De testset duurt meestal tot 30 seconden.

Experimental design

deelnemers

voor een diepgaande analyse van afwijkingen toegeschreven aan timing, stabiliteit, nauwkeurigheid en ritmiciteit in motorische bewegingen, spraak en kinematische gegevens werden geregistreerd van 34 proefpersonen die Engels als moedertaal hadden. Drieëntwintig werden eerder gediagnosticeerd met een cerebellaire ataxie (CA) toe te schrijven aan een neurodegenerative wanorde en woonden de neurologykliniek bij het Royal Victorian Eye and Ear Hospital (RVEEH) of Alfred Hospital in Melbourne bij. Elf normale proefpersonen (controles) waren vrijwilligers zonder voorgeschiedenis van neurologische aandoeningen of andere spraakstoornissen. Tabel 1 bevat een samenvatting van de cohortstatistieken. Geen van de deelnemers (controles en CA) had voorafgaand aan dit klinisch onderzoek een revalidatieprogramma ondergaan. Geen van de deelnemers (controles en CA) had voorafgaand aan dit klinisch onderzoek een revalidatieprogramma ondergaan. Een overzicht van de literatuur20, 21 en 22 toonde aan dat de leeftijd van aanvang, de leeftijd van diagnose en andere demografische factoren geen invloed hebben op de leeftijd en gmoender-gerelateerd aan ataxie. Aangezien onze studie beperkt was tot een adult-onset ataxie cohort, was strikte naleving van de leeftijd en het geslacht matched criteria niet haalbaar.

Tabel 1 Klinische karakterisering van de deelnemende deelnemers.

ethische goedkeuring en toestemming om deel te nemen

Deze studie werd goedgekeurd door de Human Research and Ethics Committee, Royal Victorian Eye and Ear Hospital, East Melbourne, Australië (Hrec referentienummer: 11/994H/16) en ondersteund door het Florey Institute of Neuroscience and Mental Health, Melbourne, Australië via de National Health and Medical Research Council (NHMRC) Grant: gnt1101304 en app1129595. Alle methoden in deze studie werden uitgevoerd in overeenstemming met relevante richtlijnen en voorschriften en voorafgaand aan hun inschrijving werd schriftelijke toestemming van alle deelnemers verkregen. Informed consent werd verkregen van beide proefpersonen om de afbeeldingen afgebeeld in de Fig. 1.

testprotocol en feature extraction

de objectieve beoordelingen van de negen neurologische tests zijn gegroepeerd in de volgende 5 domeinen met een korte beschrijving van hun uitvoeringsprotocol. Een samenvatting van kenmerken die cruciaal bleken in de diagnose van CA in de desbetreffende respectieve studie4,6,7,8,9,10,11 is ook opgenomen voor elke testsectie in Tabel 2.

Tabel 2 Korte beschrijving van de karakterisering van de 172 kenmerken van de 9 neurologische tests.

spraak

  • herhaalde lettergreep (Spe): de kandidaat moest de medeklinker/ta/ 5 seconden herhalen met de gewenste snelheid. De opnamen werden gemaakt met behulp van een condensatormicrofoon die op een afstand van ongeveer 10 cm van de mond van de proefpersoon werd geknipt in een rustige kamer met een laag omgevingsgeluidsniveau. Een android-telefoon met behulp van het programma BioKinMobi onder toezicht van een professionele onderzoeker vastgelegd de toespraak. Een op topografische prominentie gebaseerd geautomatiseerd algoritme werd gebruikt om zes akoestische kenmerken uit de trein van herhaalde/ta/ lettergreep uitingen te extraheren4, 6.

  • regelmaat van de duur meet de variabiliteit in het ritme van herhaalde/ta/ (RT) uitingen. Dit wordt geà dentificeerd als een integrale maat van timing tekorten uit de golfgegevens bij 50% prominentie.

  • Gap regelmaat meet het tijdsverschil variabiliteit tussen twee opeenvolgende/ ta / lettergreep pieken.

  • gemiddelde piek prominentie gemeten De gemiddelde relatieve hoogte / piek voor een specifieke/ta/ puls beschouwd.

  • compensatie regelmaat gemeten de variabiliteit in de berekende verschillen tussen de piek en de overeenkomstige prominentie voor een specifieke/ta/syllabische puls.

  • demping ratio gemeten Het gemiddelde van de/ ta / lettergrepen’ demping ratio berekend op basis van de golfgegevens geëxtraheerd bij 75% prominentie.

  • resonantiefrequentie gemeten Het gemiddelde van de resonantiefrequentie van de/ ta / lettergrepen berekend op de golfgegevens geëxtraheerd bij 50% prominentie.

bovenste ledemaat

  • Ritmische vingertaptest (FIN): deelnemers tikte ritmisch met hun wijsvinger tegen een horizontaal oppervlak (bv. tafelblad) met hun gewenste snelheid en duur. Een BioKin werd gemonteerd op de rug van de wijsvinger voor data-acquisitie. De eerste 3 hoofdcomponenten (PC) van multiscale entropie, gemeten op basis van de x-en Z-assen van accelerometersignalen en de x-as van gyroscoop-signalen en de variatiecoëfficiënt van het Inter-tap-interval dat de onregelmatigheid van het ritme meet, waren de geselecteerde karakteristieken.7

  • Vingerneustest (FNT): De deelnemers moesten hun neus aanraken met hun wijsvinger en vervolgens, met dezelfde vinger, de vinger van de clinicus aanraken die ongeveer 25 cm van de neus van de patiënt was geplaatst. Handbewegingen werden gemeten door een BioKin aan het dorsum van de hand van de wijsvinger. Resonantiefrequentie en amplitude bij resonantiefrequentie waren de kritische karakteristieken 8 zoals vastgelegd door de BioKin die aan de palm van de wijsvinger is bevestigd. De frequentiedomeinbeschrijving van versnelling en hoeksnelheid werd gebruikt om de resonantie in elke orthogonale as (X, Y en Z)vast te leggen 8.

  • Dysdiadochokinesietest (DDK): deelnemers moesten het dorsum van de ene hand op de palm van de andere hand plaatsen, zoals afgebeeld in Fig. 1. De deelnemers kregen vervolgens de instructie om hun hand te proneren, zodat de palmzijde naar beneden gericht is om op de palm van de andere hand te rusten. Het onderwerp wordt ook geïnstrueerd om afwisselend tussen deze twee posities zo snel en nauwkeurig mogelijk te proneren en te supineren. De snelheid van afwisseling wordt geëxtraheerd uit de BIOKIN IMU bevestigd aan de pols. Deze test onderzocht op het onvermogen om beweging te coördineren. De mate van verandering van pronaat en supinaat, resonantiefrequentie en amplitude bij resonantiefrequentie waren de kritische karakteristieken 8.

  • Ballistic tracking (BAL): deelnemers moesten op een monitorscherm naar het doel wijzen. De beweging van de wijsvinger werd gedetecteerd met behulp van de Kinect-camera en werd gepresenteerd als een marker op het scherm. Het doel is om het doel nauwkeurig te volgen via de geprojecteerde (met de Kinect-camera) markering op het scherm wanneer het doel snel en Willekeurig van punt naar punt op de monitor beweegt. De volgende geëxtraheerde kenmerken vertoonden een significante correlatie met het invaliditeitsniveau dat is vastgelegd door de standaard klinische maat SARA9:

  • fout: de afstand tussen de marker en de doeltrajectoriën, gemeten met behulp van de dynamische Tijdsvervormingsmethode in de horizontale(H) en verticale(V) as.

  • uitgebreide tijdsvertraging: Dit werd berekend als de kruiscorrelatie voor de twee-tijdsequentie, marker en doel.

  • kinematische vertraging: deze werd verkregen met behulp van de index of performance measurement in Fitts’ law. De functie is om de prestaties van het onderwerp te meten bij het bereiken van een doelpositie.

  • richtingsverandering in de H-en V-as: dit is het aantal keren dat de deelnemer zijn versnelling wijzigde, gemeten in termen van richtingsverandering. Deze functie bevatte informatie over over/onderspringen en de prestaties van de proefpersoon tijdens de test. Het hogere niveau van dysmetria leidde een groter foutenpercentage af vanaf het verschil tussen het doel en de markertrajecten.

onderste ledemaat

  • Hielscheentest (HST): de deelnemers moesten een hiel op de tegenoverliggende knie plaatsen en deze langs de tibia, tussen de hiel en de knie, herhaaldelijk en zo nauwkeurig mogelijk uitvoeren. De BioKin zat vast aan de rug van de voet. Resonantiefrequentie en amplitude bij resonantiefrequentie waren de kritische karakteristieken 8.

  • Ritmische voettapping (FOO): Deelnemers moesten ritmisch elke voet tikken tegen een horizontaal oppervlak (bijvoorbeeld vloer). De eerste 3 hoofdcomponenten (PC) van multiscale entropie gemeten vanaf de x-en Z-assen van accelerometersignalen en de x-as van gyroscopesignalen, en de variatiecoëfficiënt van inter-tap-interval die de onregelmatigheid van het ritme meet, waren de geselecteerde karakteristieken 7.

balans

  • Romberg-test (ROM): deelnemers moesten zo lang mogelijk met voeten bij elkaar staan en vervolgens met voeten uit elkaar, armen langs de zijkanten (tot 30 seconden); eerst met open ogen en dan met gesloten ogen. Een BioKin werd ongeveer op het xiphisternum gepositioneerd door middel van een elastische neopreen riem. De tweede BioKin werd bevestigd op de bovenrug, in het midden van de lijn net onder de nek. De Fuzzy entropietechniek werd toegepast op de houdingssnelheid die werd afgeleid uit de gemeten truncale versnellingen. De entropiewaardes23 van de afgeleide snelheid werden voornamelijk beschouwd als een maat voor neurale motorische controle tijdens een rustige staande houding waarvan een aanzienlijk deel evenredig is met de sway-snelheid van het lichaam. De onzekerheid bij de snelheidsmeting bevatte een aanzienlijk niveau van informatie met betrekking tot de truncale stabiliteit10.

loop

  • looptest (WAL): de deelnemers moesten 5 meter lopen en 10 keer terugkeren. De bewegingen van het onderwerp werden vastgelegd door de ingebouwde traagheidssensoren van een smartphone bevestigd aan het xiphisternum door middel van een elastische neopreen riem en twee BioKin sensoren, bevestigd aan elke enkel. De sensor werd zo geplaatst dat de X -, Y-en Z-assen respectievelijk ML – (Midden-laterale), AP – (Antero-posterieure) en VT – (Verticale As) bewegingen opvingen. In elke orthogonale as (X, Y en Z) werd de frequentiedomeinbeschrijving gebruikt om de resonantie vast te leggen11. Voor elk onderwerp werden de magnitude en de resonantie in elke as gebruikt om een feature vector te vormen. Een ander kenmerk, fuzzy entropy-based velocity irregularity measure voor truncal abnormality (VI) werd gekozen in de studie11 om de loopwillekeurigheid of onzekerheid niveau tijdens het lopen te meten. De studie in23 introduceerde vage entropie (FuzzyEn) om truncal ataxie te vangen.

in verband met het ataxische cohort dat in onze studie is opgenomen, wordt voor degenen met een SARA – score 7 Voor lopen-in het geval dat een loophulp vereist is, wordt de patiënt verzocht de test uit te voeren met het juiste loophulpmiddel (d.w.z. een enkelvoudige stok of vierwielig frame (4WF)).

Ataxische dimensies (ster)

De Werken van Gordon Holmes hebben vaak een fundamentele invloed op ons begrip van de klinische symptomen en tekenen van cerebellaire lesionen2,3,24. In onze studie herbekekenden we Holmes ‘ benadering van het karakteriseren van de beweging van proefpersonen met cerebellaire dysfunctie in termen van vier dimensies (stabiliteit, Timing, nauwkeurigheid & Ritmiciteit).

  • stabiliteit (S): dit heeft betrekking op stabiliteit in het platform (van uitvoering). Het platform is de gewrichten en spieren die relatief vast en laat het bewegende lichaamsdeel om een taak nauwkeurig uit te voeren. De DDK-taak vereist bijvoorbeeld relatieve stabiliteit van de schouder-en elleboogflectie en-extensie voor een efficiënte uitvoering. Relatieve instabiliteit leidt tot een toename van onnodige bewegingen in secundaire Assen.

  • Timing (T): wanneer CA aanwezig is, blijken taken met een tijdsbeperking, zoals BAL, meestal een verhoogde latentie te hebben voordat de beweging begint en wordt de taak met een lagere snelheid uitgevoerd, omdat een minder directe koers wordt gevolgd. Dezelfde kenmerken zijn vaak zichtbaar, zelfs bij afwezigheid van tijdsdruk. Deze functies zijn duidelijker wanneer de CA is ernstiger, wat suggereert dat, onbewust, timing is een neutrale afweging om de taak te voltooien. In computationele termen, zagen we het als de fout tussen het doel ten opzichte van wat wordt bereikt, waarschijnlijk beïnvloed door de volgende twee:

  • tijd voor het subject om een moment te starten.

  • tijd om een beweging te voltooien (snelheid).

    • nauwkeurigheid (a): conceptueel kan een taak langzaam worden voltooid, maar het meest efficiënte doel volgen. Onder deze omstandigheden beschouwen we dit als een” accurate ” prestatie. Wanneer een minder direct pad wordt gevolgd (bijvoorbeeld in de bal-taak) of er onder of over shoot is, dan zal de taak ‘fouten’ zijn in vergelijking met een controleprestatie (waarbij wordt erkend dat dit ook kan worden geassocieerd met timing fouten). In computationele termen, in deze studie herkennen we het als fout tussen het doel/de ruimte doelstellingen ten opzichte van wat wordt bereikt in een ruimtelijke context (statisch).

    • Ritmiciteit (R): onregelmatigheid bij herhaalde bewegingen.

De kenmerken voor elke test in ons voorgestelde COA-systeem worden toegewezen aan de bovengenoemde dimensies via de volgende tweestapsbenadering:

  1. (a) de uitvoeringsas is de richting van de primaire beweging die nodig is om de beoogde taak uit te voeren en zou toeschrijven aan ritmiciteit of tijdsdimensie.

    (b) elke afwijking van het meest efficiënte of het standaardpad dat vereist is om de taak uit te voeren, wordt beschouwd als nauwkeurigheidskenmerken.

  2. excessieve bewegingen in de andere assen worden beschouwd als secundaire bewegingen en zijn toe te schrijven aan de stabiliteitsdimensie.

een picturale weergave in Fig. 2 illustreert de STERINTERPRETATIE voor elk domein, volgens de voorgestelde 2-stap benadering.

Figuur 2

STERETIKETTERINGSCRITERIA.

in repetitieve tests (DDK, FNT, FIN, FOO, HST) draagt de resonantiefrequentie langs de y-as (primair) bij aan de snelheid en wordt daarom beschouwd als een timingfunctie, terwijl de resonantiegrootte wordt beschouwd als een ritmische functie. De secundaire bewegingen / storingen in andere assen worden stabiliteitskenmerken genoemd.

voor doelgebaseerde tests (bal) wordt elke vertraging in de primaire beweging van het najagen van het doel beschouwd als een timing-functie; hoe goed een doel wordt bereikt of welke mate van afwijking dan ook bij het bereiken van het doel definieert de prestaties van de deelnemer en meet dus de nauwkeurigheid; elk ander kenmerk dat betrekking heeft op buitensporige/inefficiënte bewegingen wordt gemarkeerd onder stabiliteit.

de looptest bestaat uit in een rechte lijn (langs de AP-as) naar voren lopen in een regelmatig tempo door elke voet ritmisch op te heffen en neer te zetten. Dit zou ritmische informatie af te leiden, terwijl de omvang van de truncale zwaaien van AP as (dat wil zeggen, beweging in ML as) zal afleiden nauwkeurigheid informatie. Bovendien wordt elke ongewenste slingering in de VT-as beschouwd als stabiliteitskenmerk.

voor de balance test wordt van een deelnemer verwacht dat hij een stabiele rechte houding aanhoudt langs zijn VT-as. Dit is hun primaire beweging, elke afwijking of slingering in VT-as zal rekening houden met onnauwkeurigheid en elke andere ongewenste truncale slingering in AP of ML worden beschouwd als stabiliteit functies.

voor spraaktesten worden de kenmerken die de ritmische aard van de herhaalde /ta/ uitingen meten, bijvoorbeeld de kloof tussen opeenvolgende /ta/ uitingen, de duur van a /ta/ beschouwd als ritmische kenmerken en de resonantiefrequentie als een timingfunctie. Lagere demping ratio geeft een hogere oscillatie. Vandaar dat de lagere dempingsverhouding van A /ta/ uiting, als ataxische akoestische functie, duidt op instabiliteit van het vocale kanaal tijdens de stemarticulatie.

een samenvatting van de negen tests in 5 domeinen, die 172 kenmerken genereren, wordt weergegeven met hun STERINTERPRETATIE in Tabel 2.

klinische beoordeling

CA werd gescoord door een ervaren clinicus volgens de SARA schaal, terwijl proefpersonen met ataxie elke taak uitvoerden. SARA is een klinische schaal ontwikkeld door Schmitz-Hübsch et al.25,26 die een waaier van verschillende impairments in cerebellaire ataxie beoordeelt, variërend van spraak tot evenwicht. De schaal bestaat uit 8 categorieën met scores variërend als, Gang (0-8 punten), houding (0-6 punten), zitten (0-4 punten), spraakstoornis (0-6 punten), vinger chase (0-4 punten), neus-vinger test (0-4 punten), snelle afwisselende handbeweging (0-4 punten), hiel-scheenbeen slide (0-4 punten). Zodra de clinicus elk van de 8 categorieën voor een individu beoordeelt, kunnen zij de cumulatieve score die zich van 0 (geen ataxie) tot 40 (strengste ataxie) uitstrekken verder berekenen om de strengheid van ataxie van het ataxic onderwerp te bepalen. In onze studie, om subjectieve vooroordelen te vermijden, beoordeelde één clinicus alle taken.

3-tier evaluatieschema van COA-systeem

de technieken die in het voorgestelde geïnstrumenteerde systeem (COA-systeem) moeten worden opgenomen, worden aangetoond door middel van een stroomdiagram (Fig. 3) en beschreven in de volgende subsecties.

Figuur 3

3-tier evaluatieproces stroomschema van COA-systeem.

Feature reduction and statistical analysis

oorspronkelijke feature extraction voor elke test waren gebaseerd op relevante eerdere studies4,6,7,8,9,10,11. In totaal werden 172 kenmerken geïdentificeerd als essentieel voor de objectieve beoordeling van individuele tests. Procesmetingen bevatten veel gecorreleerde of redundante gegevens. Het is belangrijk om ze te verwijderen en de functies die de meest onafhankelijke relevantie dragen extraheren. Principal Component Analysis (PCA)27 is een datacompressie -, extractie-en visualisatietool die wordt gebruikt om verschillende geassocieerde factoren om te zetten in een groep van niet-gecorreleerde variabelen. PCA wordt gebruikt om de originele 172 kenmerken te comprimeren in 27 stuks (3 stuks van elk van de 9 tests) (Fig. 3). Bovendien komt kritische informatie niet uit een enkele variabele van een individuele test, maar vaak uit de relatie tussen variabelen, dat wil zeggen hoe ze onderling verschillen. PCA is de meest geschikte onder de veelgebruikte multivariate statistische methoden voor het evalueren van dergelijke informatie, omdat het grote aantallen sterk gecorreleerde, lawaaierige en redundante factoren kan beheren.

De p-waarde voor het testen van hypothesen wordt berekend voor de verdeling van de resulterende 3 stuks (PCs 1-2-3) van elke test met betrekking tot elk van de 5 domeinen (spraak, bovenste ledemaat, onderste ledemaat, gang, balans) om te bepalen of de groepen proefpersonen (controle en ataxische) significant verschillen. In elk domein worden individuen met SARA groter dan nul, gegroepeerd als ataxisch, en controles en proefpersonen die een SARA score van 0 scoorden voor een bepaalde test worden gegroepeerd als normaal. Niet-parametrische statistische tests (Kolmogorov—Smirnov (KS) en Mann-Whitney-Wilcoxon (MWW)) worden aangenomen om veronderstellingen over de distributie van gegevens te voorkomen.

Grafiettheorie & centraliteitsmaten

visuele kwantificering van de test/domein afhankelijkheden

Grafiettheorie wordt toegepast om verdere inzichten te verkrijgen in de relaties tussen tests en domeinen. Tests en domeinen werden toegewezen aan de knooppunten van een netwerk, die de knooppunten samengevoegd door randen met lengtes die Spearman ‘ S rang correlatiecoëfficiënten (ρ). De centraliteit van een knooppunt geeft het aantal randen aan dat aan dat knooppunt grenst en de nabijheid van alle andere knooppunten die wordt beschouwd als een indicatie van het belang van het knooppunt. De frequentie dat een knooppunt verschijnt op het kortste pad tussen twee andere knooppunten is ook een maat van belang. De minimum Spanning Tree (MST) analysis28 wordt in onze studie gebruikt als een betrouwbare maatstaf voor het vergelijken van de netwerken tussen verschillende groepen, omdat het onpartijdig is en geen willekeurige parameterinstellingen29 vereist. MST is pas onlangs toegepast op hersenennetwerken29 en identificatie van kritieke genen in diabetes mellitus30. De MST is een subgrafiek die alle knooppunten verbindt om de totale randlengte te verminderen. In deze zin is de MST het “backbone” netwerk dat de inter-test/domein afhankelijkheden inkapselt. Om de nabijheid te meten, gebruiken we de volgende afbeelding om de rank correlatiecoëfficiënten van Spearman (ρ) om te zetten in afstanden.

$$f (\rho) =1-\rho ,$$
(1)

$$or,f(\rho) = \sqrt{2(1-\rho)}.$$
(2)

MST van deze grafiek wordt berekend door de tests/domeinen toe te wijzen aan de knooppunten van een netwerk en de knooppunten te verbinden via randen met lengtes gegeven door ρ.

overzicht van het belang van de test / het domein door gebruik te maken van grafiekcentraliteitsmetingen

die de tests en domeinen in een grafiekvorm weergeven, kan de relatie tussen hen worden gekwantificeerd. Aangezien wiskundige grafieken intrinsiek knooppunt significantie metingen karakteriseren, worden de tests / domeinen toegewezen aan die knooppunten als zeer relevant beschouwd bij het meten van CA. Feature importance score wordt vervolgens berekend op de gehele grafiek met behulp van populaire centraliteit maatregelen zoals graad centraliteit, nabijheid centraliteit en Tussenness30. De incidentie of graad centraliteit van een knoop in een gegeven grafiek telt het aantal randen grenzend aan dat knooppunt dat wiskundig gedefinieerd is als,

$${C}_{D}(N)={\RM{\deg }}(N),$$
(3)

waarbij, g := (n, e) de gegeven grafiek is met |n| knooppunten en |e| randen. In een verbonden grafiek wordt de gemiddelde lengte van het kortste pad tussen het knooppunt en alle andere knooppunten in het netwerk aangeduid als de genormaliseerde nabijheid centraliteit (of nabijheid) van een knooppunt. Daarom impliceert een hoge waarde van nabijheid dat het knooppunt centraal of significant is. Nabijheid wordt gedefinieerd als de reciproke som van de afstanden van de knoop tot alle andere knopen, dat wil zeggen

$${C}_{C}({N}_{1})=\frac{1}{{\sum }_{y}d({N}_{2},{N}_{1})},$$
(4)

waarbij d(N1, N2) de afstand is tussen hoekpunten N1 en N2. Op dezelfde manier berekent de Tussenheid van een knooppunt hoe vaak dat knooppunt verschijnt tussen twee andere knooppunten in de grafiek op het kortste pad. Een hoge waarde van Between betekent dat het knooppunt relevant is. De Betweenness van een knooppunt N wordt aangeduid als,

$${C}_{B}(N\rangle =\som _{{N}_{1}\ne N\ne {N}_{2}\N}\,\frac{{\sigma }_{{N}_{1}{N}_{2}}(N\rangle }{{\sigma }_{{N}_{1}{N}_{2}}},$$
(5)

Classificatie experiment

Binaire indeling

De volgende stap van de regeling bestaat uit een diagnose of een binaire indeling probleem vergelijken met de discriminatie van de prestaties van elk van de afzonderlijke tests, de gecombineerde 9 test en twee verlaagde subsets met behulp van een Willekeurig Bos (RF) classifier31. Elk kenmerk bijgedragen aan elk van de 4 holmeshian dimensies in verschillende mate (de gewichten) die dienovereenkomstig werden berekend voor de totale 9 test evenals voor de optimale subset van tests.

Multilabel classification

in onze studie wordt een willekeurig forest gebaseerd algoritme voor Multilabel Classification32 gebruikt.

De feature input in het multilabel classificatieprobleem van onze studie bestond uit 27 hoofdcomponenten van alle tests (3 stuks x 9 tests). Het doel was om de handicaps in 5 domeinen te identificeren (0: normaal; 1: ataxic). Bijvoorbeeld, een deelnemer wordt vertegenwoordigd door de domeinen van spraak, bovenste ledemaat, onderste ledemaat, gang en balans; en de mogelijke label powerset representatie van dit is een multi-class classificatieprobleem met de klassen , , , , , , , , …, waar, bijvoorbeeld, duidt op een deelnemer wiens domeinen van spraak en onderste ledemaat worden beïnvloed terwijl de domeinen bovenste ledemaat, gang en evenwicht worden beïnvloed.

functie belang (of rang) in RF model

in het begin wordt de optimale bladgrootte in een RF classifier geverifieerd door middel van vergelijking van gemiddelde Kwadraatfouten (MSE) verkregen door Classificatie voor verschillende bladgrootten (5, 10, 20, 50 en 100). De optimale bladgrootte moet de laagste MSE waarden opleveren. Zodra we de optimale bladgrootte hebben geschat, wordt een groter ensemble gekweekt en gebruikt om het belang van de functie te schatten. Om het belang van de functie in het diagnostische model voor willekeurige forest te berekenen, wordt in eerste instantie de MSE van het model met de oorspronkelijke variabelen berekend. Vervolgens worden de waarden van een enkele kolom (die functie 1 Voor n-waarnemingen vertegenwoordigt) gepermuteerd en wordt de MSE opnieuw berekend. Bijvoorbeeld, als een kolom de functiewaarden x1, x2, x3, x4 neemt en een willekeurige permutatie van de waarden resulteert in x4, x3, x1, x2; dan zal dit resulteren in een nieuwe MSE. Het verschil in MSE wordt gemiddeld over alle bomen in het ensemble en gedeeld door de standaardafwijking over de bomen voor elke variabele. Hoe groter deze waarde, hoe belangrijker de variabele is. Het verschil zal naar verwachting positief zijn, maar als het een negatief getal is, dan betekent dit dat de willekeurige permutatie beter werkte en dat de functie geen rol speelt in de voorspelling en niet belangrijk wordt geacht.

STERBEREKENING

zodra het belang/de rangorde van de 3 PC-functies is geëvalueerd voor een specifieke test via het Random Forest ranking scheme, wordt het gewicht van de oorspronkelijke functie als volgt berekend:

$$feature\_weights=WOF\_InPC{1}^{\ast }R\_PC1+WOF\_InPC{2}^{\ast }R\_PC2+WOF\_InPC{3}^{\ast }R\_PC3,$$
(6)

waarbij WOF: gewicht van deze functie in een PC-component; R: rang van de pc-functie in RF-model. Aangezien elk kenmerk betrekking heeft op een van de 4 holmeshian dimensies, de bijdrage van de algehele stabiliteit, Timing, nauwkeurigheid en Ritmiciteit dimensie is de geaccumuleerde gewicht van alle stabiliteit, Timing, nauwkeurigheid en Ritmiciteit kenmerken respectievelijk.

Cross validation (CV)

voor beide classificatieproblemen worden de gegevens gestratificeerd met behulp van een Leave-one-out (LOO) cv-techniek. Cross-validatie in multilabel-instellingen wordt bemoeilijkt door het feit dat de gewone (binaire/multiclass) manier van gestratificeerde bemonstering niet van toepassing is; alternatieve manieren van benaderende gestratificeerde bemonstering zijn voorgesteld in33. Dus, in onze studie, werd de multi-label stratificatie uitgevoerd met behulp van een iteratieve techniek.

Evaluatiemetingen

de prestaties van de classificeerder worden geëvalueerd met behulp van de metrics, Precision, Recall, F1-score, Accuracy en Matthews Correlation Coefficient (MCC)34. Deze metrics worden berekend voor elk domein op basis van de voorspelde waarden na elke validatie in LOO (34 keer). Algemene precisie, recall, F1 score, nauwkeurigheid van multilabel classificatie probleem zijn het gemiddelde van de resultaten via LOO in de 5 domeinen. Bijvoorbeeld,

$ $ general \ _precision = sum(precision\_values\_in \ _5\_domains) / 5.$$
(7)

functie ranking via een RF-trein & validatie met LOO is het gemiddelde van alle rang in elke training en validatiefase, voor zowel de binaire als multilabel classificatieproblemen.