objektiv bedömning av cerebellär ataxi: ett omfattande och förfinat tillvägagångssätt
omfattande objektiv bedömning (COA) system
i denna studie använde vi BioKin17, en molnbaserad realtidsrörelseinspelningssensorplattform för att utföra en omfattande objektiv bedömning av CA. BioKin17 är en trådlös bärbar enhet med en inbäddad Tri-axiell accelerometer (modell chipset ”MPU-9150” från InvenSense, Inc., San Jose, CA, USA) och en IEEE802.11b/g/n / trådlöst Kommunikationsgränssnitt som körs på en 32-bitars ARM-processor. BioKin-sensorsystemet utvecklat av Networked Sensing and Control Lab, Deakin University, kan interagera med en Android-mobilapplikation för att fånga komplexa rörelser i en mänsklig kropp i realtid, som illustreras i Fig. 1. Den är optimerad för att minska sedimenteringseffekter och sensordriftproblem genom att eliminera korsaxeljusteringsfel mellan varje tröghetssensor17. Denna sensor var bänk märkt mot en konventionell flera kamera baserat optiskt rörelsespårningssystem (Vicon system, T40s, Oxford, Storbritannien), en hög precision bänk märkningssystem18. BioKin fångade gyroskopet och accelerationsdata i de tredimensionella (3D) kartesiska koordinaterna med en samplingshastighet på 50 Hz. Ca-bedömningen utfördes genom följande steg:
-
Rörelseingångar genererade av nio instrumenterade tester som efterliknar de nio standardkliniska testerna på ca som täcker de 5 domänerna.
-
dessa fångas av sensorer och visualiseras med en stödjande applikation i en smartphone.
-
trådlös överföring till ett blockchain-baserat distribuerat molnnät19 där diagnostiska och bedömningsalgoritmer tillämpas.
-
dataanalysresultat omvandlas till ett kliniskt relevant format.
en bildrepresentation av sensorplattformen illustreras i Fig. 1.
Motion input
försökspersoner gjordes för att utföra nio standard kliniska tester; upprepad stavelse yttrande (SPE), rytmisk finger knacka (FIN), finger-näsa/näsa-finger (FNT), dysdiadochokinesi (DDK), ballistisk spårning/finger-chase (BAL), häl-shin (HST), fot knacka (FOO), hållning/romberg (ROM) och gång (WAL). Uppgifterna utförs i linje med instruktionerna som anges i SARA som täcker alla 5 domäner. För att undvika störande faktorer på grund av svängning när testerna utfördes i sittande läge tillhandahölls deltagarna axiellt stöd, dvs sittande bekvämt i upprätt sittande läge. Stolens ryggstöd var vinklat 90-100 grader med tillräckligt timmerstöd i linje med nedre delen av ryggen. Både höger och vänster ben bedömdes.
datainsamling
COA-systemet använde Tröghetsmätningsenheter (IMU) utrustade I BioKin-systemet i sju av testerna för att fånga translationell och roterande kinematik i ortogonala axlar via accelerometrar och gyroskop. En Microsoft Kinect V2-kamera utrustad med en 23-tums bildskärm och mini-dator med en Intel core i5-processor användes också i ett av testerna för markörbaserad rörelseinspelning och för att få den absoluta positionsinformationen.
molnbaserade algoritmer
de inspelade data överförs sedan till blockchain baserade distribuerade moln nätverk19 via den trådlösa anslutningen för efterföljande databehandling som gör det möjligt för läkare att förvärva svårighetsgrad poäng. Matlab (r2019a, MathWorks) och Python-miljöer behandlade data som överförs via trådlösa medel.
klinisk utgång
den fångade data visualiseras genom android-baserade smart phone ansökan, BioKin som genererar utvärderingsrapporter och svårighetsgrad poäng som ett resultat av molnbaserad databehandling.
i vårt COA-System är de genomsnittliga tidsmässiga utgifterna för att förvärva data via motion capture från var och en av de 6 perifera testerna (DDK, FNT, FIN, BAL, FOO, HST) mindre än 15 sekunder. Balanstestet(ROM) tar mindre än 30 sekunder; gångtestet (WAL) tar mindre än 90 sekunder medan taltestet (SPE) tar mindre än 5 sekunder att skaffa data. Därför är de genomsnittliga tidsmässiga utgifterna för att skaffa data och generera ett kumulativt testresultat (med molnbaserade algoritmer) för en enda patient ungefär under 215 sekunder respektive 5 sekunder. Testuppsättningen tar vanligtvis upp till 30 sekunder.
experimentell design
deltagare
för en djupgående analys av abnormiteter som tillskrivs timing, stabilitet, noggrannhet och rytmicitet i motoriska rörelser registrerades tal-och kinematiska data från 34 personer vars modersmål var engelska. Tjugotre diagnostiserades tidigare med en cerebellär ataxi (CA) på grund av en neurodegenerativ sjukdom och deltog i Neurologikliniken vid Royal Victorian Eye and Ear Hospital (RVEEH) eller Alfred Hospital i Melbourne. Elva normala försökspersoner (kontroller) var frivilliga utan någon historia av neurologiska tillstånd eller andra talproblem. Sammanfattning av kohortstatistiken ges i Tabell 1. Ingen av deltagarna (kontroller och CA) hade genomgått något rehabiliteringsprogram före denna kliniska undersökning. Ingen av deltagarna (kontroller och CA) hade genomgått något rehabiliteringsprogram före denna kliniska undersökning. En granskning av litteraturen20,21,22 avslöjade att ålder av början, ålder av diagnos och andra demografiska faktorer inte påverkar ålder och GMO-relaterade till ataxi. Eftersom vår studie var begränsad till en ataxikohort för vuxna, strikt efterlevnad av ålders-och könsmatchade kriterier var inte genomförbart.
Etikgodkännande och samtycke att delta
denna studie godkändes av Human Research and Ethics Committee, Royal Victorian Eye and Ear Hospital, East Melbourne, Australien (HREC referensnummer: 11/994H/16) och stöds av Florey Institute of Neuroscience and Mental Health, Melbourne, Australien genom National Health and Medical Research Council (NHMRC) Grant: gnt1101304 och app1129595. Alla metoder i denna studie utfördes i enlighet med relevanta riktlinjer och föreskrifter och skriftligt samtycke erhölls från alla deltagare innan de anmäldes. Informerat samtycke erhölls från båda ämnena för att publicera bilderna som avbildades i Fig. 1.
testprotokoll och extraktion av funktioner
de objektiva bedömningarna av de nio neurologiska testerna grupperas i följande 5 domäner med en kort beskrivning av deras exekveringsprotokoll. En sammanfattning av funktioner som visade sig vara avgörande vid diagnosen CA i den relaterade respektive studien4,6,7,8,9,10,11 har också inkluderats för varje test underavsnitt i Tabell 2.
tal
-
upprepad stavelseuttalande (SPE): kandidaten var skyldig att upprepa konsonant-vokalstavelsen/ta/ i 5 sekunder vid sin föredragna hastighet. Inspelningarna gjordes med hjälp av en kondensatormikrofon klippt på ett ungefärligt avstånd av 10 cm från motivets mun i ett tyst rum med låg omgivande ljudnivå. En android-telefon med programmet BioKinMobi under en professionell utredares övervakning fångade talet. En topografisk framträdande baserad automatiserad algoritm användes för att extrahera sex akustiska egenskaper från tåget av upprepade/ta/ stavelse uttalances4,6.
-
regelbundenhet av varaktigheten mäter variationen i rytmen av upprepad/ ta / (RT) yttrande. Detta identifieras som ett integrerat mått på tidsunderskott extraherade från vågdata vid 50% framträdande.
-
Gap regelbundenhet mäter tidsskillnaden variabilitet mellan två på varandra följande/ ta / stavelse toppar.
-
Genomsnittlig topp framträdande mätt den genomsnittliga relativa höjden/toppen för en specifik/ ta / puls beaktas.
-
Kompensationsregularitet mätte variationen i skillnaderna beräknade mellan toppen och dess motsvarande framträdande för en specifik/ta / syllabisk puls.
-
Dämpningsförhållande mätt medelvärdet av/ ta / stavelsernas dämpningsförhållanden beräknade från vågdata extraherade vid 75% framträdande.
-
resonansfrekvens mätt medelvärdet av/ ta / stavelsernas resonansfrekvens beräknad på vågdata extraherad vid 50% framträdande.
Övre extremitet
-
rytmiskt fingertappningstest (FIN): deltagarna knackade rytmiskt pekfingret mot en horisontell yta (t.ex. bordsskiva) med önskad hastighet och varaktighet. En BioKin monterades på dorsum på pekfingret för datainsamling. De första 3 huvudkomponenterna (PC) av multiscale entropi mätt från X-och Z-axlarna för accelerometersignaler och X-axeln för gyroskopsignaler och variationskoefficienten för Inter-tap-intervallet som mätte rytmens oregelbundenhet var de valda funktionerna7.
-
finger-näsa test (FNT): Deltagarna var tvungna att röra näsan med sitt spetsiga pekfinger och sedan, med samma finger, nå ut och röra klinikens finger placerat cirka 25 cm från motivets näsa. Handrörelser mättes med en BioKin fäst vid dorsum av handen på pekfingret. Resonansfrekvens och amplitud vid resonansfrekvens var de kritiska funktionerna8 som fångats av BioKin fäst vid pekfingerens handflata. Frekvensdomänen beskrivning av acceleration och vinkelhastighet användes för att fånga resonansen i varje ortogonal axel (X, Y och Z)8.
-
Dysdiadochokinesi test (DDK): deltagarna var tvungna att placera dorsum på ena handen på handflatan, som avbildas i Fig. 1. Deltagarna instruerades sedan att pronera sin hand, så att palmsidan vetter nedåt för att vila på den andra handens handflata. Ämnet instrueras också att pronera och supinera alterntely mellan dessa två positioner så snabbt och exakt som möjligt. Växlingshastigheten extraheras från Biokins IMU fäst vid handleden. Detta test undersöktes för oförmåga att samordna rörelse. Förändringshastigheten för pronat och supinat, resonansfrekvens och amplitud vid resonansfrekvens var de kritiska funktionerna8.
-
ballistisk spårning (BAL): deltagarna var tvungna att peka på målet på en bildskärm. Rörelsen av pekfingret upptäcktes med Kinect-kameran och presenterades som en markör på skärmen. Målet är att noggrant följa målet via den projicerade (med Kinect-kameran) markören på skärmen när målet rör sig snabbt och slumpmässigt från punkt till punkt på bildskärmen. Följande extraherade funktioner visade en signifikant korrelationsnivå med funktionshinder som fångats av standard klinisk åtgärd SARA9:
-
fel: avståndet mellan markör och målbanor, mätt med dynamisk Tidsvridningsmetod i den horisontella(H) och vertikala(V) axeln.
-
omfattande tidsfördröjning: Detta beräknades som korskorrelationen för tvåtidssekvensen, markören och målet.
-
kinematisk fördröjning: detta erhölls med hjälp av indexet för prestandamätning i Fitts lag. Funktionen är att mäta motivets prestanda för att nå en målposition.
-
riktningsändring i H-och V-axeln: detta är antalet gånger deltagaren ändrade sin acceleration som mättes i termer av riktningsförändring. Denna funktion innehöll information om över/undershooting samt ämnets prestanda under testet. Högre nivå av dysmetri härledde en större felfrekvens enligt skillnaden mellan målet och markörbanorna.
Nedre extremitet
-
Heel-shin test (HST): deltagarna var tvungna att placera en häl på motsatt knä och köra den längs tibia, mellan hälen och knäet repetitivt och så exakt som möjligt. BioKin var fäst vid fotens dorsum. Resonansfrekvens och amplitud vid resonansfrekvens var de kritiska funktionerna8.
-
Rhythmic foot tapping (FOO): Deltagarna var tvungna att rytmiskt knacka varje fot mot en horisontell yta (t.ex. golv). De första 3 huvudkomponenterna (PC) av multiscale entropi mätt från X-och Z-axlarna för accelerometersignaler och X-axeln för gyroskopsignaler, och variationskoefficienten för Inter-tap-intervall som mätte oregelbundenheten i rytmen var de valda funktionerna7.
balans
-
Romberg test (ROM): deltagarna var tvungna att stå med fötterna ihop och sedan med fötterna ifrån varandra, armarna vid sidorna så länge som möjligt (upp till 30 sekunder); först med öppna ögon och sedan med slutna ögon. En BioKin placerades ungefär på xiphisternum med hjälp av ett elastiskt neoprenbälte. Den andra BioKin fästes på den övre ryggen, i mittlinjen strax under nacken. Fuzzy entropi teknik användes på postural svänghastighet härledd från de uppmätta trunkala accelerationerna. Entropivärden23 av den härledda hastigheten betraktades främst som ett mått på neural motorstyrning under en tyst stående hållning, varav en betydande del är proportionell mot kroppens svänghastighet. Osäkerheten i hastighetsmätningen innehöll en betydande informationsnivå med avseende på trunkal instabilitet10.
gång
-
gångtest (WAL): deltagarna var tvungna att gå i 5 meter och återvända som upprepades 10 gånger. Motivets rörelser fångades av de inbyggda tröghetssensorerna på en smartphone fäst vid xiphisternum med hjälp av ett elastiskt neoprenbälte och två Biokinsensorer, fästa vid varje fotled. Sensorn placerades så att dess X -, Y-och Z-axlar fångade ML (Medio-Lateral), AP (Antero-Posterior) respektive VT (vertikal axel) rörelser. I varje ortogonal axel (X, Y och Z) användes frekvensdomänbeskrivningen för att fånga resonansen11. För varje ämne användes storleken och resonansen i varje axel för att bilda en funktionsvektor. En annan funktion, fuzzy entropi-baserad hastighet oregelbundenhet åtgärd för truncal abnormality (VI) valdes i studien11 för att mäta gångens slumpmässighet eller osäkerhetsnivå under gång. Studien in23 introducerade fuzzy entropi (FuzzyEn) för att fånga truncal ataxi.
med hänvisning till den ataxiska kohorten som är inskriven i vår studie, för dem med SARA – poäng 7 för promenader-i det fall ett gånghjälp krävs, uppmanas patienten att utföra testet med hjälp av lämpligt gånghjälpmedel (dvs. en enda punktspinne eller fyrhjulig ram (4WF)).
Ataxic dimensions (STAR)
Gordon Holmes verk citeras ofta som ett grundläggande inflytande på vår förståelse av de kliniska symptomen och tecknen på cerebellära lesioner2,3,24. I vår studie reviderade vi Holmes tillvägagångssätt för att karakterisera motivets rörelse med cerebellär dysfunktion i termer av fyra dimensioner (stabilitet, Timing, noggrannhet & rytmicitet).
-
stabilitet (er): Detta avser stabilitet i plattformen (för utförande). Plattformen är lederna och musklerna som är relativt fasta och tillåter den rörliga kroppsdelen att utföra en uppgift exakt. Till exempel kräver DDK-uppgiften relativ stabilitet i axel-och armbågens flexion och förlängning för effektivt utförande. Relativ instabilitet resulterar i en ökning av onödiga rörelser i sekundära axlar.
-
Timing (T): när CA är närvarande visar sig uppgifter som har en tidsbegränsning, såsom BAL, vanligtvis ha ökad latens innan rörelsen börjar och uppgiften utförs med en långsammare hastighet, eftersom en mindre direkt kurs tas. Samma funktioner är ofta uppenbara även i avsaknad av tidsbegränsningar. Dessa funktioner är tydligare när CA är allvarligare, vilket tyder på att, undermedvetet, timing är en neutral avvägning för att slutföra uppgiften. I beräkningsmässiga termer erkände vi det som felet mellan målet mot vad som uppnås, vilket sannolikt kommer att påverkas av följande två:
-
tid för ämnet att initiera ett ögonblick.
-
dags att slutföra en rörelse (hastighet).
-
noggrannhet (a): konceptuellt kan en uppgift slutföras långsamt men följa det mest effektiva målet. Under dessa omständigheter anser vi att detta är en ”exakt” prestanda. När en mindre direkt väg följs (till exempel i Bal-uppgiften) eller det finns under eller över skott, kommer uppgiften att vara ’fel’ jämfört med en kontrollprestanda (erkänner att detta också kan vara förknippat med tidsfel). I beräkningsmässiga termer känner vi i denna studie det som fel mellan mål/rymdmålen mot vad som uppnås i ett rumsligt sammanhang (statiskt).
-
rytmicitet (R): oregelbundenhet i upprepade rörelser.
-
funktionerna för varje test i vårt föreslagna COA-System tilldelas de ovannämnda dimensionerna genom följande 2-stegs tillvägagångssätt:
-
(a) exekveringsaxeln är riktningen för den primära rörelsen som krävs för att utföra den avsedda uppgiften och skulle tillskriva rytmicitet eller tidsdimension.
(b) varje avvikelse från den mest effektiva eller standardvägen som krävs för att utföra uppgiften skulle betraktas som noggrannhetsfunktioner.
-
överdrivna rörelser i de andra axlarna skulle betraktas som sekundära rörelser och attribut till stabilitetsdimensionen.
en bildrepresentation i Fig. 2 illustrerar STJÄRNTOLKNINGEN för varje domän, enligt den föreslagna 2-stegsmetoden.
i repetitiva tester (DDK, FNT, FIN, FOO, HST) bidrar resonansfrekvensen längs y-axeln (primär) till hastighet och betraktas därför som en tidsfunktion medan resonansens storlek betraktas som en rytmisk egenskap. De sekundära rörelser / störningar som finns i andra axlar kallas stabilitetsfunktioner.
För målbaserade tester (BAL) betraktas varje fördröjning i den primära rörelsen för att jaga målet som en tidsfunktion; hur väl ett mål uppnås eller någon grad av avvikelse för att uppfylla målet definierar deltagarens prestanda och mäter därmed noggrannhet; alla andra funktioner som tillgodoser överdrivna/ineffektiva rörelser markeras under stabilitet.
gångtestet består av att gå framåt i en rak linje (längs AP-axeln) i regelbunden takt genom att lyfta och sätta ner varje fot på ett rytmiskt sätt. Detta skulle sluta rytmicitetsinformation medan omfattningen av trunkal svängning från AP-axeln (det vill säga rörelse I ML-axeln) kommer att dra slutsatsen om noggrannhet. Dessutom betraktas alla oönskade svängningar i VT-axeln som stabilitetsfunktion.
för balansprov förväntas en deltagare upprätthålla en stadig rak hållning längs sin VT-axel. Detta är deras primära rörelse, varje avvikelse eller sway i VT-axeln kommer att redogöra för felaktighet och alla andra oönskade truncal sway i antingen AP eller ML betraktas som stabilitetsfunktioner.
för taltest betraktas funktionerna som mäter den rytmiska naturen hos de upprepade /ta/ uttalandena, till exempel klyftan mellan på varandra följande /ta/ uttalanden, varaktigheten av a /ta/ som rytmicitetsfunktioner och resonansfrekvensfunktionen som en tidsfunktion. Lägre dämpningsförhållande indikerar en högre svängning. Därför indikerar det lägre dämpningsförhållandet för a /ta/ yttrande, som en ataxisk akustisk egenskap, instabilitet i vokalkanalen under röstartikulering.
en sammanfattning av de nio testerna i 5 domäner som genererar 172 funktioner presenteras med sin STJÄRNTOLKNING i Tabell 2.
klinisk bedömning
CA gjordes av en erfaren kliniker enligt SARA-skalan medan patienter med ataxi utförde varje uppgift. SARA är en klinisk skala som utvecklats av Schmitz-h Jacobsch et al.25,26 som bedömer en rad olika försämringar i cerebellär ataxi, allt från tal till balans. Skalan består av 8 kategorier med poäng som sträcker sig som, gång (0-8 poäng), hållning (0-6 poäng), sittande (0-4 poäng), talstörning (0-6 poäng), fingerjakt (0-4 poäng), näsfingertest (0-4 poäng), snabb växlande handrörelse (0-4 poäng), häl-shin slide (0-4 poäng). När läkaren bedömer var och en av de 8 kategorierna för en individ kan de ytterligare beräkna den kumulativa poängen från 0 (ingen ataxi) till 40 (mest allvarlig ataxi) för att bestämma ataxiets svårighetsgrad av ataxi. I vår studie, för att undvika subjektiv bias, bedömde en kliniker alla uppgifter.
3-tier utvärderingsschema för COA-system
de tekniker som ska införlivas i det föreslagna instrumenterade systemet (COA-systemet) demonstreras genom ett flödesschema (Fig. 3) och beskrivs i följande underavsnitt.
funktionsreduktion och statistisk analys
originalfunktionsextraktion för varje test baserades på relevanta tidigare studier4,6,7,8,9,10,11. Totalt 172 funktioner identifierades som kritiska för objektiv bedömning av individuella tester. Processmätningar innehåller många korrelerade eller överflödiga data. Det är viktigt att ta bort dem och extrahera de funktioner som har den mest oberoende relevansen. Principal Component Analysis (PCA)27 är ett datakomprimerings -, extraktions-och visualiseringsverktyg som används för att omvandla flera associerade faktorer till en grupp okorrelerade variabler. PCA används för att komprimera de ursprungliga 172-funktionerna till 27-datorer (3-datorer från var och en av de 9-testerna) (Fig. 3). Dessutom kommer kritisk information inte från en enda variabel i ett individuellt test, men härrör ofta från förhållandet mellan variabler, dvs hur de varierar. PCA är den mest lämpliga bland de vanligaste multivariata statistiska metoderna för att utvärdera sådan information eftersom den kan hantera stora antal starkt korrelerade, bullriga och överflödiga faktorer.
p-värdet för hypotesprovning beräknas för fördelningarna av de resulterande 3 st (st 1-2-3) för varje test med avseende på var och en av de 5 domänerna (tal, övre extremitet, Nedre extremitet, gång, balans) för att avgöra om grupperna av ämnen (kontroll och ataxisk) skiljer sig avsevärt. I varje domän, individer med SARA mäter större än noll, grupperas som ataxic, och kontroller och ämnen som gjorde en SARA poäng på 0 för ett visst test grupperas som vanligt. Icke-parametriska statistiska tester (Kolmogorov Kubi”Smirnov (ks) och Mann-Whitney-Wilcoxon (MWW)) antas för att undvika antaganden om datadistribution.
grafteori& centralitetsåtgärder
visuell kvantifiering av test/domänberoende
grafteori tillämpas för att få ytterligare insikter i förhållandena mellan tester och domäner. Tester och domäner tilldelades noderna i ett nätverk, som sammanfogade noderna med kanter med längder som representerar Spearmans rankkorrelationskoefficienter (kub). Centraliteten hos en nod anger antalet kanter som gränsar till den noden och närheten till alla andra noder som betraktas som en indikation på nodens betydelse. Frekvensen som en nod visas på den kortaste vägen mellan två andra noder är också ett mått på betydelse. Analysen28 används i vår studie som ett tillförlitligt mått för att jämföra nätverk mellan olika grupper eftersom det är opartiskt och inte kräver godtyckliga parameterinställningar29. MST har nyligen tillämpats på hjärnnät29 och identifiering av kritiska gener i diabetes mellitus30. MST är en delgraf som förbinder alla noder för att minska den totala kantlängden. I denna mening är MST ”backbone”-nätverket som inkapslar inter-test/domänberoende. För att mäta närhet använder vi följande kartläggning för att översätta Rankkorrelationskoefficienterna för Spearman (kub) till avstånd.
MST i denna graf beräknas genom att tilldela testen/domänerna till noderna i ett nätverk och ansluta noderna via kanter med längder som ges av kub.
översikt över test / domän betydelse med hjälp av graf centrala mått
representerar tester och domäner i en graf form möjliggör kvantifiering av relationerna mellan dem. Eftersom matematiska grafer i sig karaktäriserar nodbetydelsemätningar anses de tester/domäner som tilldelats dessa noder vara mycket relevanta vid mätning av CA. Funktionen betydelse poäng beräknas sedan på hela grafen med hjälp av populära Centralitetsåtgärder som Grad centralitet, närhet Centrality och Betweenness30. Förekomsten eller gradens centralitet för en nod i en given graf räknar antalet kanter som gränsar till den noden som matematiskt definieras som,
där g := (n, e) är den givna grafen med| N |noder och| e / kanter. I en ansluten graf betecknas den genomsnittliga längden på den kortaste vägen mellan noden och alla andra noder i nätverket som normaliserad Närhetscentral (eller närhet) för en nod. Därför innebär ett högt värde av närhet att noden är central eller signifikant. Närhet definieras som det ömsesidiga av summan av avstånden från noden till alla andra noder, det vill säga
där d(N1, N2) är avståndet mellan hörn N1 och N2. På samma sätt beräknar en nods Betweenness hur ofta den noden visas mellan två andra noder i diagrammet på den kortaste vägen. Ett högt värde av Betweenness betyder att noden är relevant. Betweenness av en nod n betecknas som,
Klassificeringsexperiment
binär klassificering
nästa steg i systemet består av en diagnos eller ett binärt klassificeringsproblem som jämför diskrimineringsprestanda för var och en av de enskilda testerna, det kombinerade 9-testet och två reducerade delmängder med en slumpmässig Skogsklassificerare (RF) 31. Varje funktion bidrog till var och en av de 4 Holmeshian dimensionerna i varierande grad (vikterna) som beräknades i enlighet därmed för det totala 9-testet såväl som för den optimala delmängden tester.
multilabel classification
i vår studie används en slumpmässig skogsbaserad antagen algoritm för Multilabel Classification32.
funktionsinmatningen i multilabel-klassificeringsproblemet i vår studie bestod av 27 huvudkomponenter från alla tester (3 st x 9 tester). Målet var att identifiera funktionshinder i 5 domäner (0: normal; 1: ataxic). Till exempel representeras en deltagare av domänerna för tal, övre extremitet, Nedre extremitet, gång och balans; och den möjliga märkningen powerset representation av detta är ett klassificeringsproblem med klasserna i flera klasser , , , , , , , , …, där, till exempel, betecknar en deltagare vars domäner av tal och nedre extremitet påverkas medan domänerna övre extremitet, gång och balans påverkas inte.
feature importance (eller rank) i RF-modellen
i början verifieras den optimala bladstorleken i en RF-klassificerare genom att jämföra Medelkvadratfel (MSE) erhållna genom klassificering för olika bladstorlekar (5, 10, 20, 50 och 100). Den optimala bladstorleken bör ge de lägsta MSE-värdena. När vi har uppskattat den optimala bladstorleken odlas en större ensemble och används för att uppskatta funktionens betydelse. För att beräkna funktionens betydelse i den slumpmässiga skogsdiagnostiska modellen beräknas initialt MSE för modellen med de ursprungliga variablerna. Därefter permuteras värdena för en enda kolumn (som representerar funktion 1 för N observationer) och MSE beräknas igen. Till exempel, om en kolumn tar funktionsvärdena x1, x2, x3, x4 och en slumpmässig permutation av värdena resulterar i x4, x3, x1, x2; då kommer detta att resultera i en ny MSE. Skillnaden i MSE är i genomsnitt över alla träd i ensemblet och dividerat med standardavvikelsen som tagits över träden för varje variabel. Ju större detta värde desto mer signifikant är variabeln. Skillnaden förväntas vara positiv, men om det är ett negativt tal, innebär det att den slumpmässiga permutationen fungerade bättre och drog slutsatsen att funktionen inte har någon roll i förutsägelsen och inte anses vara viktig.
STJÄRNBERÄKNING
När betydelsen / rankningen för de 3 PC-funktionerna har utvärderats för ett specifikt test genom Random Forest ranking scheme, beräknas vikten på den ursprungliga funktionen enligt följande:
där WOF: vikten av denna funktion i en PC-komponent; r: rangordning av PC-funktionen i RF-modellen. Eftersom varje funktion avser en av de 4 Holmeshian dimensioner, bidraget från den totala stabilitet, Timing, noggrannhet och rytmicitet dimension är den ackumulerade weigtage av alla stabilitet, Timing, noggrannhet och rytmicitet funktioner respektive.
Korsvalidering (CV)
för båda klassificeringsproblemen stratifieras data med hjälp av en leave-one-out (LOO) CV-teknik. Korsvalidering i multilabel-inställningar kompliceras av det faktum att det vanliga (binära/multiclass) sättet för stratifierad provtagning inte är tillämpligt; alternativa sätt att approximera stratifierad provtagning har föreslagits I33. Så i vår studie utfördes stratifieringen med flera etiketter med en iterativ teknik.
Utvärderingsmått
klassificerarens prestanda utvärderas med hjälp av mätvärden, Precision, återkallelse, F1-poäng, noggrannhet och Matthews korrelationskoefficient (MCC)34. Dessa mätvärden beräknas för varje domän baserat på de förutsagda värdena efter varje validering i LOO (34 gånger). Allmän precision, återkallelse, F1-poäng, noggrannhet för multilabel klassificeringsproblem är genomsnittet av resultaten genom LOO i 5-domänerna. Till exempel
Feature ranking genom ett RF-tåg& validering med LOO är genomsnittet av all rang i varje tränings-och valideringsfas, för både binära och multilabel klassificeringsproblem.
Leave a Reply