Dec 21, 2023
Wahl des Voxels
Band Kommunikationsbiologie
Kommunikationsbiologie Band 5, Artikelnummer: 913 (2022) Diesen Artikel zitieren
2521 Zugriffe
4 Zitate
9 Altmetrisch
Details zu den Metriken
Die Grundlagenforschung und die klinische Neurowissenschaft haben enorm von der Entwicklung automatisierter Computeranalysen profitiert. Mittlerweile werden jedes Jahr mehr als 600 Arbeiten zur menschlichen Neurobildgebung mit Voxel-basierter Morphometrie (VBM) veröffentlicht, und es werden eine Reihe verschiedener automatisierter Verarbeitungspipelines verwendet. Es muss jedoch noch systematisch bewertet werden, ob sie zu denselben Antworten kommen. Hier untersuchten wir die Variabilität zwischen vier häufig verwendeten VBM-Pipelines in zwei großen Datensätzen zur Gehirnstruktur. Die räumliche Ähnlichkeit und die Reproduzierbarkeit der verarbeiteten Gehirnkarten der grauen Substanz zwischen den Pipelines waren zwischen den Pipelines im Allgemeinen gering. Die Untersuchung von Geschlechtsunterschieden und altersbedingten Veränderungen ergab erhebliche Unterschiede zwischen den Pipelines hinsichtlich der identifizierten spezifischen Regionen. Auf maschinellem Lernen basierende multivariate Analysen ermöglichten genaue Vorhersagen von Geschlecht und Alter, allerdings unterschied sich die Genauigkeit zwischen den Pipelines. Unsere Ergebnisse legen nahe, dass allein die Wahl der Pipeline zu einer erheblichen Variabilität der Gehirnstrukturmarker führt, was eine ernsthafte Herausforderung für die Reproduzierbarkeit und Interpretation darstellt.
Die grundlegende und klinische Neurowissenschaft des Menschen zielt darauf ab, den Beitrag spezifischer Gehirnsysteme zu mentalen Prozessen und Störungen zu bestimmen. Neuroimaging-Ansätze wurden zu diesem Zweck häufig eingesetzt. Aufgrund ihrer hohen räumlichen Auflösung und ihres nichtinvasiven Charakters sind die auf der Magnetresonanztomographie (MRT) basierenden Beurteilungen der Gehirnstruktur und -funktion zu einer der am weitesten verbreiteten Neuroimaging-Techniken geworden. Allerdings können die Komplexität und Flexibilität der Arbeitsabläufe bei MRT-Analysen sowie die Unterschiede zwischen den wenigen häufig verwendeten Analysesoftwarepaketen zu einer hohen Variabilität der Neuroimaging-Ergebnisse führen1. Diese Variabilität erschwert die Interpretation der Ergebnisse im Hinblick auf die genaue Kartierung mentaler Prozesse und gehirnbasierter Biomarker für psychische Störungen. Im Vergleich zur Verarbeitung funktioneller MRT-Daten (fMRT) ermöglichen Gehirnmorphometrieanalysen von T1-gewichteten Strukturbildern weniger Verarbeitungsschwankungen und können eine höhere Test-Retest-Zuverlässigkeit aufweisen1,2,3,4,5,6. Dennoch kann die Wahl der Analysesoftware einen erheblichen Einfluss auf die erzielten Ergebnisse haben. Die Variabilität hinsichtlich der Frage, ob und welche bestimmten Gehirnregionen die statistische Schwelle überschreiten, hat wiederum großen Einfluss auf die Interpretation der Ergebnisse im Hinblick auf Struktur-Funktions-Mapping oder gehirnbasierte Biomarker und kann die Sensitivität nachfolgender Neuroimaging-Metaanalysen erheblich beeinträchtigen .
Die neuroanatomische Forschung hat enorm von der Entwicklung automatisierter Rechenansätze wie der Voxel-basierten Morphometrie (VBM) profitiert, die Variationen im regionalen Volumen der grauen Substanz untersucht, und den neueren oberflächenbasierten Ansätzen (z. B. der Untersuchung der kortikalen Dicke). VBM stellt einen der bisher am häufigsten verwendeten Ansätze zur Strukturanalyse des Gehirns dar (z. B. ergab eine einfache Literatursuche mit dem Begriff „Voxel-basierte Morphometrie“ oder „VBM“ auf PubMed 6210 Studien, https://pubmed.ncbi.nlm. nih.gov, von 1993 bis 19. November 2020, siehe auch Veröffentlichungen für VBM und andere Ansätze wie „kortikale Dicke“ und „Oberfläche“ in PubMed (siehe Abbildung S1). Der standardisierte und hochautomatisierte VBM-Workflow umfasst die Segmentierung der grauen Substanz aus anderen Hirngeweben, die Normalisierung in den standardmäßigen stereotaktischen Raum und die Glättung mit einem Gaußschen Kernel, bevor Inferenzstatistiken angewendet werden. Die entsprechenden voxelweisen statistischen Inferenzmodelle bestimmen üblicherweise (1) Unterschiede zwischen Gruppen im regionalen Volumen der grauen Substanz (GMV), z. B. zwischen Patienten und Kontrollpersonen oder Männern und Frauen7,8,9,10, oder (2) Assoziationen zwischen Individuen Variationen im regionalen GMV und Verhaltensphänotypen, einschließlich Lern-, Alters- oder störungsrelevanter Merkmale11,12,13,14,15,16. Signifikante Unterschiede oder Assoziationen werden üblicherweise regionalspezifisch interpretiert, z. B. indem bestimmte Verhaltensfunktionen bestimmten Gehirnsystemen zugeordnet werden und bestimmt wird, welche Gehirnregionen altersbedingte Veränderungen erfahren oder welche Regionen zu psychischen Störungen beitragen. In jüngerer Zeit werden auf maschinellem Lernen basierende multivariate Analyseansätze wie Multivariate Pattern Analyses (MVPA) zunehmend auf VBM-Daten angewendet, um subtile und räumlich verteilte Muster von Hirnstrukturvariationen zu erkennen und so die biomarkerbasierte Diagnostik psychischer Störungen zu verbessern17,18,19 . MVPA zielt auf die gleichzeitige Bestimmung von Variationen im räumlichen Muster über mehrere Voxel hinweg ab und ist daher häufig empfindlicher bei der Erkennung von Unterschieden zwischen Gruppen oder strukturellen Zusammenhängen des Gehirns. Der Ansatz basiert auf Trainingsmustererkennungsalgorithmen, beispielsweise Gehirnstrukturdaten, und kann auf neue Daten angewendet werden, um die Gruppenzugehörigkeit (z. B. Patienten vs. Kontrollpersonen oder Frauen vs. Männer) oder individuelle Variationen einer kontinuierlichen Variablen wie z. B. vorherzusagen als Alter.
Für VBM-Analysen wurde eine Reihe von Softwarepaketen entwickelt, die in großem Umfang eingesetzt werden. Zu den derzeit am weitesten verbreiteten gehört unter anderem die Computational Anatomy Toolbox (CAT, www.neuro.uni-jena.de/cat), die in der Statistical Parametric Mapping Software (SPM, https://www.fil) implementiert ist. ion.ucl.ac.uk/spm/software/spm12/) und FSLVBM und FSLANAT, die auf der FMRIB Software Library (FSL, https://fsl.fmrib.ox.ac.uk) basieren. Um die Robustheit und Reproduzierbarkeit von Neuroimaging-Analysen zu verbessern, wurden kürzlich neue modulare Vorverarbeitungspipelines für strukturelle MRT (z. B. sMRIPrep, https://www.nipreps.org/smriprep/) entwickelt. Obwohl die Softwarepakete im Allgemeinen ähnliche Verarbeitungsschritte wie volumetrische T1-gewichtete (anatomische) MRT-Daten verwenden, bestehen Unterschiede in den spezifischen Verarbeitungsschritten und ihrer Implementierung. Dies wirft die Frage auf, ob die Wahl spezifischer Software und die Anwendung softwarespezifischer Standardverarbeitungskonfigurationen zu Variabilität in den Ergebnissen führen kann.
Eine kürzlich durchgeführte Studie untersuchte die Zuverlässigkeit und Reproduzierbarkeit kortikaler Dickenmessungen unter Verwendung verschiedener Softwarepakete in großen Datensätzen gesunder Probanden und berichtete über eine ähnliche kortikale Dickenverteilung über Softwarepakete hinweg, obwohl die absoluten geschätzten Werte zwischen den Pipelines erheblich schwankten20. Im Gegensatz dazu zeigten Studien, die die Reproduzierbarkeit von VBM in Proben neurologischer Patienten untersuchten, erhebliche Unterschiede zwischen den Verarbeitungspipelines, und die Ergebnisse legen nahe, dass die ausgewählte VBM-Verarbeitungspipeline die klinische Interpretation stark beeinflusst21,22. Insbesondere stellen Ungenauigkeiten bei der räumlichen Normalisierung und unterschiedliche Vorlagen und Methoden für die räumliche Normalisierung eine der Hauptannahmen von VBM in Frage, nämlich dass individuelle Gehirnunterschiede und anatomische Korrespondenz von Gehirnbereichen während des räumlichen Normalisierungsprozesses erhalten bleiben23,24,25,26,27. Darüber hinaus fehlt für VBM eine eindeutige histologische und neurobiologische In-vivo- oder Ex-vivo-Validierung beim Menschen23. Zusammengenommen stellt dies die Interpretation von VBM-Befunden als biologisch plausible Marker für hirnbasierte Störungen oder phänotypische Variationen in Frage.
Vor diesem Hintergrund wurde in der vorliegenden Studie systematisch untersucht, ob die Wahl der Verarbeitungssoftware die Ergebnisse einer VBM-Studie beeinflusst. Wir haben die am häufigsten verwendeten Verarbeitungssoftwarepakete (FSLVBM und FSLANAT, wie in FSL v6.0 implementiert, und CAT12.7, alle aktuelle Versionen) sowie eine interne Pipeline mit einigen sMRIPrep-Funktionen (Version 0.6.2) einbezogen. Die sMRIPrep-Pipeline diente als Beispiel für eine angepasste Pipeline, die auf verschiedenen Neuroimaging-Softwarepaketen basiert. Um den typischen wissenschaftlichen Arbeitsablauf zu modellieren, wurden die empfohlenen Standardkonfigurationen verwendet, um Unterschiede zwischen Gruppen und biologische Zusammenhänge innerhalb zweier unabhängiger Stichproben gesunder Personen (n = 200; n = 494) zu bestimmen. Angesichts der zuvor berichteten geringen Robustheit der Zusammenhänge zwischen psychologischen Variablen und der Gehirnstruktur siehe Lit. 28 konzentrierten wir uns auf biologische Variablen, also Geschlecht und Alter9,10,29,30,31,32.
Um die Auswirkungen der Wahl der Verarbeitungspipeline auf die Ergebnisse einer typischen VBM-Studie zu bestimmen, untersuchten wir Geschlechtsunterschiede und altersbedingte Veränderungen mit univariaten Analysen (Gruppenunterschiede bzw. Regression) sowie multivariaten Analysen (basiert auf maschinellem Lernen). MVPA) in zwei großen Datensätzen (Datensatz 1, n = 200, Alter 18–26, 100 Frauen; Datensatz 2, n = 494, Alter 19–80, 307 Frauen) nach Verarbeitung der Daten mit den häufig verwendeten VBM-Pipelines (Abb. 1). Im Einzelnen wurden die folgenden systematischen Schritte durchgeführt. Zunächst wurden räumliche Ähnlichkeit und Intraklassenkorrelation (ICC, sowohl voxelweise als auch bildbasierte Schätzungen) untersucht, um vor weiteren statistischen Analysen die räumliche Ähnlichkeit, Homogenität und Reproduzierbarkeit der Ergebnisse über Pipelines hinweg zu bestimmen. Zweitens wurden Ergebnisse in Bezug auf Geschlechtsunterschiede im GMV aus univariaten Gruppenvergleichen zwischen Männern und Frauen über Pipelines hinweg verglichen. Drittens wurden die Ergebnisse in Bezug auf altersbedingte GMV-Änderungen aus der univariaten linearen Regressionsanalyse über Pipelines hinweg verglichen. Schließlich wurden die Auswirkungen von Pipelines auf die Genauigkeit multivariater Vorhersagen mithilfe von MVPA-basierten Vorhersagen von Geschlecht und Alter auf der Grundlage von GMV-Karten des gesamten Gehirns über Pipelines hinweg untersucht.
*Angesichts der Tatsache, dass FSLANAT- und sMRIPrep-Pipelines hauptsächlich zur Segmentierung von GM-, WM- und CSF-Daten verwendet werden, wurden die segmentierten GM-Ergebnisse (im nativen Raum) den Vorverarbeitungsschritten von fslvbm_2_template (mit Ausnahme der Segmentierung) und fslvbm_3_proc unterzogen, um normalisierte und modulierte GM-Daten zu erzeugen .
Wir untersuchten zunächst die räumlichen Ähnlichkeitskarten der vorverarbeiteten Bilder innerhalb und zwischen den Pipelines (Abb. S2). Statistische Analysen mittels ANOVA-Modellen mit der Pipeline mit wiederholten Faktoren und der abhängigen Variablen räumliche Ähnlichkeit in Bezug auf z-transformierte räumliche Korrelationskoeffizienten ergaben eine hohe Variation in Bezug auf Pipeline und Teilnehmer, sowohl innerhalb als auch zwischen Pipelines (alle Tests wurden von Bonferroni korrigiert). p < 0,01). Detaillierte ANOVA- und Post-hoc-Ergebnisse finden Sie in den ergänzenden Materialergebnissen, Abb. S3 und den Tabellen S1–S9. Zusammengenommen weisen diese Ergebnisse auf erhebliche räumliche Unterschiede zwischen GMV-Karten derselben Teilnehmer zwischen Pipelines sowie derselben Pipeline zwischen Teilnehmern hin. Insbesondere wurde in allen Datensätzen die geringste räumliche Ähnlichkeit zwischen CAT und FSLVBM bzw. CAT und sMRIPrep beobachtet. Bemerkenswerterweise erreichte CAT im Vergleich zu den anderen Pipelines eine erheblich höhere räumliche Ähnlichkeit innerhalb der Pipeline (Abb. S3), was eine höhere Homogenität der verarbeiteten GMV-Karten zwischen den Teilnehmern widerspiegelt, als die Daten mit CAT verarbeitet wurden.
Die Untersuchung der ICC-Karten für jeden Vergleich zwischen Pipelines ergab im Allgemeinen eine geringe regionale Konsistenz zwischen den GMV-Karten, die von verschiedenen Pipelines berechnet wurden (siehe Abbildung 2 für Datensatz 1 und 2). Eine Ausnahme bildete die vergleichsweise hohe Reproduzierbarkeit zwischen FSLANAT vs. FSLVBM in Datensatz 1 und FSLANAT vs. sMRIPrep in Datensatz 2 (Abb. 2). Bemerkenswert ist, dass die verschiedenen Pipelines in den beiden Datensätzen eine relativ geringe Reproduzierbarkeit zwischen den Pipelines aufwiesen. Dies kann durch die Tatsache erklärt werden, dass die Daten in verschiedenen Bildgebungszentren, MRT-Systemen und Altersgruppen erfasst wurden, und legt nahe, dass komplexe Wechselwirkungen zwischen den technologischen, Proben- und Analysefaktoren zur Variabilität beitragen können, siehe Lit. 33. Die Untersuchung der regionalen Verteilung der Variationen auf Voxelebene ergab, dass insbesondere die parietalen und frontalen Regionen eine geringe Konsistenz zwischen den Pipelines aufwiesen. Die Untersuchung eines bildbasierten Replizierbarkeitsindex (I2C2) ergab eine allgemein schlechte Konsistenz zwischen den Pipelines (alle Bild-Intraklassen-Korrelationskoeffizienten < 0,4), was eine geringe Reproduzierbarkeit zwischen den Pipelines bestätigte. Nur die Reproduzierbarkeit zwischen CAT und FSLANAT oder CAT und FSLVBM näherte sich dem Kriterium „fair“ (Tabelle S10).
Intraklassen-Korrelationskoeffizienten (ICC) auf Voxelebene bilden die Pipelines eines Datensatzes 1 und eines Datensatzes 2 ab. L links, R rechts. Die Farbabstufung spiegelt den ICC-Wert wider.
Um den Einfluss der Wahl der Verarbeitungspipeline auf die Ergebnisse einer typischen VBM-Studie zwischen Probanden zu bestimmen, verglichen wir männliche und weibliche Teilnehmer in Datensatz 1. Um das Ausmaß gemeinsamer und unterschiedlicher Ergebnisse zwischen den Pipelines sowie den Prozentsatz gemeinsamer und unterschiedlicher Ergebnisse zu bestimmen Voxel in allen signifikanten Voxeln in den vier Pipelines wurden berechnet (ergänzende Methoden). Für parametrische Statistiken mit einer herkömmlichen pFWE-Korrektur < 0,05 auf Clusterebene wurde nur eine räumliche Überlappung der Ergebnisse für Geschlechtsunterschiede zwischen FSLANAT, FSLVBM und CAT (Tabelle 1) von 10,98 % beobachtet, während die verschiedenen Pipelines ein erhebliches Pipeline-spezifisches GMV-Geschlecht abbildeten -Unterschiede (bis zu 54,73 % eindeutige GMV-Geschlechtsunterschiede, die von einer, aber nicht von den anderen Pipelines identifiziert wurden, Tabelle 1). Bemerkenswert ist, dass die von der sMRIPrep-Pipeline vorverarbeiteten Daten keine signifikanten Geschlechtsunterschiede im GMV erkennen ließen. Zwischen den anderen Pipelines wurden Überlappungen für männlich > weiblich im Gyrus lingualis, im Precuneus, im linken Hippocampus, im bilateralen parahippocampalen Kortex, im olfaktorischen Kortex, im linken Putamen und in der linken Insula beobachtet (Abb. 3a). Bei den vier Pipelines wurden keine gemeinsamen Regionen für Frauen > Männer beobachtet. Die beiden FSL-Pipelines hatten nur eine Überlappung von 13,16 % (Tabelle 1), wobei sich die überlappenden höheren GMV für Frauen im bilateralen postzentralen Kortex, im rechten Winkel, im rechten unteren Parietallappen und im Kleinhirn befanden (Abb. 3a). Im Gegensatz zu der vergleichsweise geringen Überlappung zwischen den Pipelines wurden große Unterschiede in der Lage und dem Ausmaß der identifizierten GMV-Geschlechtsunterschiede insbesondere in den medialen präfrontalen und okzipitalen Regionen beobachtet. Während beispielsweise CAT bei Männern ein höheres GMV in weit verbreiteten Kleinhirn- und limbischen Regionen aufwies, zeigten FSLANAT und FSLVBM bei Frauen ein höheres GMV in weit verbreiteten hinteren/oberen Parietalregionen (Abb. 3a).
a Ergebnisse aus parametrischen Statistiken, die eine Überlappung zwischen Pipelines bei einem Cluster-Level pFWE < 0,05 mit einem anfänglichen Cluster-bildenden Voxel-Level p < 0,001 zeigen. Die linken Felder einer Anzeige ergeben den Kontrast männlich>weiblich. Die rechten Felder eines entsprechen dem weiblich > männlich-Kontrast. Für a und d sind die Pipelines wie folgt codiert: Rot = CAT, Grün = FSLVBM, Blau = FSLANAT, Hellblau = sMRIPrep, zusätzliche Farben visualisieren die Überlappung zwischen den Ergebnissen, z. B. CAT ∩ FSLVBM = Gelb, CAT ∩ FSLANAT = Lila, FSLVBM ∩ FSLANAT = hellblau, CAT ∩ FSLVBM ∩ FSLANAT = weiß usw. b Die Variabilität statistischer Karten ohne Schwellenwert. Die Korrelationswerte zwischen statistischen Karten ohne Schwellenwert für das gesamte Gehirn von vier Pipelines wurden jeweils für Geschlechtsunterschiede berechnet. Zu Anzeigezwecken werden nur positive Werte visualisiert. c Dekodierung der funktionellen Eigenschaften der identifizierten Gehirnregionen von männlich > weiblich (a, rot = CAT, grün = FSLVBM, blau = FSLANAT, kein Unterschied in sMRIPrep) mit NeuroSynth. Es werden nur die 20 wichtigsten Funktionsbegriffe visualisiert. Die Schriftgröße spiegelt die Größe der Korrelation wider. d Zuverlässige Gehirnmuster zur Unterscheidung von Geschlechtsunterschieden mittels Bootstrapping-Test (5000 Permutationen, pFDR < 0,05) und e kreuzweise vorhergesagte Genauigkeit von vier Pipelines in unabhängigen Stichproben. Die Farbe von kalt nach warm zeigt eine zunehmende Klassifizierungsgenauigkeit an (von 0,5 auf 1).
Die Ergebnisse der nichtparametrischen Statistik (TFCE pFWE < 0,05) waren den Ergebnissen der parametrischen Statistik sehr ähnlich, was darauf hindeutet, dass die Pipeline-Unterschiede zwischen den statistischen Modellen robust sind (Details siehe ergänzende Ergebnisse). Bemerkenswert ist, dass in einigen Fällen die Überlappung zwischen den Softwarepaketen bei Verwendung des nichtparametrischen Ansatzes leicht zunahm (Tabelle 1 und Abb. S4a).
Um potenzielle Interaktionseffekte zwischen den Vorverarbeitungspipelines und dem Schwellenwert für Mehrfachvergleiche weiter zu berücksichtigen, haben wir mit einem ähnlichen Ansatz Korrelationen zwischen statistischen Differenzkarten zwischen Gruppen ohne Schwellenwert aus den vier Pipelines berechnet (siehe Lit.). 34. Das räumliche Muster der Ähnlichkeiten geschlechtsabhängiger GMV-Unterschiede reichte von –0,0033 bis 0,6328 (Abb. 3b), wobei sMRIPrep im Vergleich zu denen, die von anderen Pipelines erhalten wurden, eine besonders geringe räumliche Überlappung der Geschlechtsunterschiede ergab. Darüber hinaus unterschieden sich die CAT-Ergebnisse stark von den Geschlechtsunterschieden, die mit den FSL-Pipelines ermittelt wurden.
Um zu untersuchen, inwieweit die verschiedenen durch die Pipelines identifizierten Regionen die funktionelle Interpretation der volumetrischen Geschlechtsunterschiede im Gehirn beeinflussen können, wurde ein metaanalytischer funktionaler Dekodierungsansatz verwendet (für einen ähnlichen Ansatz siehe Lit. 35). Der Ansatz basiert auf einer groß angelegten automatisierten Synthese funktioneller MRT-Studien, die von Plattformen wie Neurosynth unterstützt wird, und wird zunehmend verwendet, um die funktionelle Charakterisierung einer bestimmten Gehirnregion zu verbessern (siehe z. B. Lit. 36 für den konzeptionellen Hintergrund) und um helfen bei der Interpretation der GMV-Befunde, einschließlich der Geschlechtsunterschiede bei GMV35. Gemäß der metaanalytischen Dekodierung mit Neurosynth unterschieden sich die identifizierten Regionen zwischen den Pipelines hinsichtlich ihrer funktionellen Charakterisierung stark (Abb. 3c, beachten Sie, dass nur drei Pipelines signifikante Geschlechtsunterschiede aufwiesen). Dies wiederum könnte zu recht unterschiedlichen Interpretationen potenzieller Verhaltens- und kognitiver Unterschiede zwischen den Geschlechtern geführt haben.
MVPA-basierte Vorhersageansätze werden zunehmend auf voxelweise GMV-Daten angewendet, um die Gruppenzugehörigkeit zu bestimmen, einschließlich diagnostischer Gruppen sowie biologischer Geschlechtsgruppen. Um zu testen, ob die verschiedenen Pipelines die Genauigkeit der multivariaten Vorhersage beeinflussen würden, haben wir Pipeline-spezifische MVPA-Klassifikatoren für das Geschlecht entwickelt. Zu diesem Zweck wurde Datensatz 1 in einen Trainingsdatensatz (n = 100) und einen Testdatensatz (n = 100) aufgeteilt – jeweils vorverarbeitet durch identische Pipelines. Im Allgemeinen haben die für jede Pipeline entwickelten Klassifikatoren das Geschlecht in den unabhängigen Daten genau vorhergesagt (Genauigkeit zwischen 68 % (sMRIPrep) und 94 % (CAT), Cohens d = 0,2967 bis 2,2815, Abb. 3).
Die zuverlässigsten Regionen für die Klassifizierung des Geschlechts über Pipelines hinweg umfassten die medialen präfrontalen, subkortikalen, insularen, okzipitalen und parietalen Regionen. Überlappende Cluster von prädiktiven Voxeln über Pipelines hinweg wurden nur im bilateralen parahippocampalen Kortex beobachtet (Voxel jedes Clusters > 5, Abb. 3d), und es gab große Unterschiede in der Position der prädiktiven Voxel. Vorhersagen basierend auf CAT gewichteten beispielsweise stark gewichtete Voxel im Putamen, im Hippocampus, im mittleren cingulären Kortex und im Gyrus angle, während FSLANAT stark prädiktive Voxel in einem ausgedehnten Netzwerk identifizierte, einschließlich des oberen Frontalkortex, des orbitofrontalen Kortex, des prä- und postzentralen Kortex und der Insula , Schläfenpol, Gyrus angle und Kleinhirn. FSLVBM und sMRIPrep zeigten im Allgemeinen ähnliche Ergebnisse wie FSLANAT.
Um den Einfluss der Verarbeitungspipelines auf die Vorhersagegenauigkeit im unabhängigen Datensatz weiter zu validieren, wurden die Klassifikatoren aus den Trainingsdaten jeder Pipeline auf die unabhängigen Daten angewendet, die von den anderen Pipelines verarbeitet wurden. Trotz der geringen räumlichen Überlappung zwischen den Schwellenwert-Vorhersagekarten (Tabelle S11) konnten alle Klassifizierungen über Pipelines hinweg das Geschlecht genau vorhersagen (58–94 %, Cohens d = 0,1392–2,2815), mit Ausnahme der Verwendung des auf sMRIPrep entwickelten Musters zur Vorhersage des Geschlechts aus FSLVBM-verarbeiteten Daten (50 %, Cohens d = 0,2930) oder CAT (14 %, Cohens d = –1,4909) (Abb. 3e, entsprechendes Cohens d und Leistungsdetails in den Tabellen S12 und S13). Insbesondere erreichten Pipeline-übergreifende Vorhersagen zwischen den FSL-Pipelines die höchste Genauigkeit (>86 %) sowie eine relativ hohe Genauigkeit für die Vorhersage der von sMRIPrep verarbeiteten Daten (FSLANAT: 80 %, Cohens d = 0,6437 und FSLVBM: 76 %, Cohens). d = 0,7231) und CAT (FSLANAT: 72 %, Cohens d = 0,7810 und FSLVBM: 76 %, Cohens d = 0,7402). Für eine weitere unabhängige Validierung des Geschlechtsvorhersagemusters in Datensatz 2 siehe Ergänzende Ergebnisse.
Zusätzlich zur Bestimmung von Unterschieden zwischen Gruppen in der Gehirnmorphometrie wird VBM häufig verwendet, um Zusammenhänge zwischen Variationen biologischer Variablen und GMV zu untersuchen. Zusammenhänge zwischen Alter und Schwankungen des GMV werden beispielsweise häufig im Hinblick auf altersbedingte Gehirnveränderungen interpretiert. Um zu untersuchen, wie sich die verschiedenen Pipelines auf die Ergebnisse von Assoziationsstudien auswirken – insbesondere auf die Identifizierung von Regionen, die altersbedingten Veränderungen unterliegen – haben wir Unterschiede zwischen den Pipelines im Hinblick auf die Bestimmung altersbedingter volumetrischer Veränderungen in einem Regressionsansatz untersucht. Mithilfe parametrischer Statistiken (pFWE auf Clusterebene <0,05 Schwelle) zeigten alle Pipelines, dass der GMV mit zunehmendem Alter abnimmt. Die Überlappung aller Pipelines wurde jedoch nur im mittleren Gyrus occipitalis beobachtet (Abb. 4a und Tabelle 2). Eine weitere Untersuchung ergab, dass FSLANAT eine eher geringe Überlappung mit den anderen Pipelines aufwies, wohingegen die anderen drei Pipelines zusätzlich häufige altersbedingte Rückgänge in den medialen präfrontalen, cingulären und einigen parietalen und temporalen Regionen identifizierten (Abb. 4a). Im Gegensatz dazu wurden altersbedingte Anstiege nur in zwei Pipelines (FSLVBM und sMRIPrep) mit minimaler Überlappung im Kleinhirn beobachtet (3,41 % Überlappung, Abb. 4a und Tabelle 2). Im Allgemeinen zeigten die Ergebnisse eine hohe Variabilität sowohl hinsichtlich der Richtung (FSLVBM und sMRIPrep) als auch des Ausmaßes des altersbedingten Effekts (sMRIPrep). Bei nichtparametrischen Statistiken mit TFCE pFWE < 0,05 waren die Ergebnisse den parametrischen Statistiken sehr ähnlich, insbesondere für Gehirnregionen, die mit zunehmendem Alter abnahmen (Abb. S4b und Tabelle 2, Einzelheiten siehe ergänzende Ergebnisse).
a Ergebnisse, die die Überlappung zwischen Pipelines bei einem Cluster-Level pFWE < 0,05 mit einem anfänglichen Cluster-bildenden Voxel-Level p < 0,001 anzeigen. Die linken Felder eines zeigen Gehirnregionen mit zunehmendem GMV mit zunehmendem Alter. Die rechte Bildfläche nimmt mit zunehmendem Alter ab. Für a und d sind die Pipelines wie folgt codiert: Rot = CAT, Grün = FSLVBM, Blau = FSLANAT, Hellblau = sMRIPrep, zusätzliche Farben visualisieren die Überlappung zwischen den Ergebnissen, z. B. CAT ∩ FSLVBM = Gelb, CAT ∩ FSLANAT = Lila, FSLVBM ∩ FSLANAT = hellblau, CAT ∩ FSLVBM ∩ FSLANAT = weiß usw. b Die Variabilität statistischer Karten ohne Schwellenwert. Die Korrelationswerte zwischen statistischen Karten ohne Schwellenwert für das gesamte Gehirn von vier Pipelines wurden jeweils für altersbedingte Effekte berechnet. Zu Anzeigezwecken werden nur positive Werte visualisiert. c Zuverlässige Gehirnmuster zur Vorhersage des Alters, ermittelt durch Bootstrapping-Tests (5000 Permutationen, pFDR < 0,05) und d kreuzweise vorhergesagter r-Wert von vier Pipelines für jede der Pipeline-verarbeiteten Proben. Die Farbe von kalt nach warm zeigt steigende r-Werte an (von 0,8 auf 1).
Eine weitere Untersuchung der räumlichen Ähnlichkeit der altersbezogenen GMV-Assoziationskarten mithilfe der Berechnung von Korrelationen zwischen statistischen Karten ohne Schwellenwert über vier Pipelines hinweg ergab Unterschiede bei den altersbezogenen Effekten im Bereich von –0,0051 bis 0,6757 (Abb. 4b). Die niedrigsten Ähnlichkeitswerte zeigten, dass FSLANAT im Vergleich zu den anderen Pipelines sehr unterschiedliche Karten für altersbedingte Veränderungen erstellte und dass sich CAT deutlich von den FSLVBM-Verarbeitungspipelines unterschied. CAT und sMRIPrep wiesen im Hinblick auf die Karten ohne Schwellenwert die größte Ähnlichkeit auf. In Übereinstimmung mit den Überlappungsergebnissen (Tabelle 2) wurde ein erheblicher Teil der Varianz zwischen Pipelines durch die Ergebnisse von FSLANAT verursacht.
Multivariate Vorhersagemodelle werden zunehmend auf GMV-Karten angewendet, um das tatsächliche Alter oder „Gehirnalter“ basierend auf der Gehirnstruktur zu bestimmen. Wir haben daher weiter untersucht, inwieweit sich die Wahl der Verarbeitungspipeline auf die Vorhersagegenauigkeit auswirken würde, sowie auf die Regionen, die am meisten zur Vorhersage beitragen. Zu diesem Zweck haben wir ein Support-Vektor-Regressionsmodell (SVR) trainiert, um das Alter basierend auf GMV-Karten vorherzusagen. Da es keinen geeigneten unabhängigen Testdatensatz gab, verwendeten wir einen Kreuzvalidierungsansatz, um die Auswirkungen von Pipelines zu bewerten, indem wir die Korrelationsstärken zwischen dem vorhergesagten und dem tatsächlichen Alter für innerhalb und zwischen Pipelines quantifizierten. In Bezug auf die räumliche Überlappung der Musterausdrücke aus den vier Pipelines befanden sich überlappende Regionen hauptsächlich im bilateralen Pallidum, bilateralen Thalamus und parahippocampalen Gyrus (Voxel jedes Clusters > 5, Abb. 4c). Es zeigten sich erhebliche räumliche Variationen (Tabelle S11). Beispielsweise zeigte FSLANAT ein hohes Vorhersagegewicht für Regionen im Putamen, Hippocampus, Hypothalamus, Hirnstamm, medialen Frontalcortex, mittleren Temporalgyrus, mittleren Frontalgyrus und Insula, während die Daten mit FSLVBM verarbeitet wurden schlugen vor, dass der Gyrus postcentralis, der Gyrus frontalis superior, der Gyrus temporalis superior und das Kleinhirn stark zur Vorhersage beigetragen haben. Trotz deutlicher Unterschiede in der räumlichen Verteilung war eine genaue Vorhersage des Alters auf der Grundlage der Daten aller Pipelines möglich, was sich in hohen Korrelationen zwischen dem vorhergesagten und dem tatsächlichen Alter widerspiegelt (alle r-Werte > 0,8, Abb. 4d).
Um die Auswirkungen der Vorlage und der Qualitätsbewertung nach der räumlichen Normalisierung zu berücksichtigen, haben wir den folgenden zweistufigen Ansatz integriert. Zuerst haben wir die Daten mithilfe derselben Brain-Vorlage in allen Pipelines erneut verarbeitet. Da die FSL-basierten Pipelines und sMRIPrep studienspezifische Vorlagen verwendeten, verwendeten wir die Vorlage von CAT in allen Pipelines (CAT-Vorlage IXI555_MNI152). Zweitens verwendeten wir eine Bewertung der Probenhomogenität (räumliche Ähnlichkeit zwischen Teilnehmern) innerhalb jeder Pipeline als Qualitätsbewertungsstrategie und schlossen Bilder mit geringer Qualität aus (Details siehe ergänzende Ergebnisse, Tabelle S14). Eine identische Strategie zur Qualitätsbewertung wird beispielsweise von CAT angewendet. Als Nächstes haben wir zusätzliche Analysen implementiert, um die Auswirkungen der Vorlage und der Qualitätsbewertung auf die Variabilität zwischen Pipelines im Hinblick auf Geschlechtsunterschiede und Altersassoziationen sowie einen direkten statistischen Vergleich zwischen Pipelines auf Voxelebene zu untersuchen.
Nach Verwendung derselben Vorlage in allen Pipelines blieben die Unterschiede zwischen Geschlecht und Alter (Abb. S5) sowie der direkte statistische Vergleich (Abb. S6 und S7) stabil. Die Variabilität zwischen den Pipelines blieb robust, nachdem die potenziellen Auswirkungen verschiedener TIV-Schätzansätze durch Angleichung von Vorlage und TIV-Berechnung über Pipelines hinweg kontrolliert wurden (Abb. S8). Darüber hinaus veränderten sich die Ergebnisse beider Analysen nach der Kontrolle der Vorlage und dem Ausschluss von Bildern, die die Qualitätskontrolle nicht bestanden hatten (Bilder mit geringer räumlicher Ähnlichkeit), erheblich (Abb. S9), was auf einen starken Effekt der Probenhomogenität schließen lässt. Obwohl die Variabilität zwischen den Pipelines mithilfe von Vorlagen und Qualitätskontrolle verringert werden konnte, blieb die erhebliche Variabilität zwischen den Pipelines bestehen (Einzelheiten siehe ergänzende Ergebnisse, Tabellen S15 und S16).
VBM gehört zu den am häufigsten verwendeten Ansätzen zur Untersuchung regionaler Unterschiede oder Variationen in der Gehirnstruktur in der Grundlagenforschung und der psychiatrischen Neurobildgebung. Wir haben hier die Variabilität der VBM-Ergebnisse zwischen häufig verwendeten Softwarepaketen und Pipelines untersucht. Darüber hinaus haben wir in zwei prototypischen VBM-Studienszenarien untersucht, wie die Wahl der Verarbeitungspipeline die Ergebnisse in Bezug auf die identifizierten Gehirnregionen beeinflusst, indem wir GMV-Unterschiede zwischen Gruppen (Geschlechtsunterschiede) oder lineare Assoziationen (altersbedingte Veränderungen) untersuchten. Zu diesem Zweck wurden Daten aus zwei unabhängigen Datensätzen mit den empfohlenen Standardoptionen in weit verbreiteten VBM-Analysepaketen (CAT12, FSL und sMRIPrep) bzw. Pipelines (FSLANAT, FSLVBM) verarbeitet. Die Untersuchung der räumlichen Ähnlichkeit zwischen den vorverarbeiteten Daten ergab deutliche Unterschiede in der räumlichen Verteilung des GMV auf Voxelebene über die Pipelines hinweg sowie in Bezug auf die räumliche Homogenität der Teilnehmerdaten innerhalb der Pipelines. Sowohl Voxel- als auch bildbasierte Replizierbarkeitsanalysen zeigten eine durchweg schlechte Reproduzierbarkeit zwischen Pipelines und bestätigten erhebliche Unterschiede bei der Schätzung des regionalen GMV. Als nächstes untersuchten wir, wie sich unterschiedliche Verarbeitungspipelines auf die Bestimmung von GMV-Variationen in zwei typischen massenunivariaten Analyseszenarien auswirken würden, wobei wir Unterschiede zwischen Gruppen (Geschlechtsunterschiede) und Assoziationen mit phänotypischen Variationen (Altersassoziationen) untersuchten. Während in den identifizierten Regionen einige Überschneidungen zwischen parametrischen und nichtparametrischen Korrekturverfahren festgestellt wurden, gab es erhebliche Unterschiede sowohl bei den GMV-Geschlechtsunterschieden als auch bei den Altersassoziationen, was darauf hindeutet, dass die Wahl der Software einen starken Einfluss auf die identifizierten Regionen hat. Zusätzlich zu massenunivariaten Methoden wurden auf maschinellem Lernen basierende Ansätze angewendet, um allgemeine Zusammenhänge zwischen subtilen räumlichen Variationen des GMV und den beiden biologischen Variablen Geschlecht und Alter zu untersuchen. Obwohl die regionale Überlappung der aussagekräftigsten Voxel zwischen den Pipelines gering war, ermöglichten die mit jeder Pipeline verarbeiteten GMV-Karten im Allgemeinen eine genaue Vorhersage der biologischen Variablen. Die Vorhersagegenauigkeit variierte innerhalb und zwischen Pipelines, was darauf hindeutet, dass die Wahl der Verarbeitungssoftware die multivariate Vorhersagegenauigkeit beeinflusst. Zusammengenommen deuten die Ergebnisse auf eine erhebliche Variabilität der erzielten Ergebnisse hin und darauf, dass die Wahl der Verarbeitungspipeline erheblichen Einfluss darauf hat, welche Regionen in VBM-Analysen identifiziert werden. Dies wiederum wird die Interpretation der Ergebnisse stark beeinflussen, z. B. hinsichtlich der Frage, „welche Gehirnregionen sich zwischen Männern und Frauen unterscheiden“ oder „welche Gehirnregionen altersbedingte Volumenrückgänge aufweisen“. Andererseits deutet die hohe Vorhersagegenauigkeit für Geschlecht und Alter darauf hin, dass alle GMV-Karten biologisch signifikante Variationen kodierten, obwohl regionalspezifische Interpretationen mit Vorsicht zu betrachten sind.
Im ersten Schritt untersuchten wir die räumliche Variabilität und Reproduzierbarkeit der vorverarbeiteten GMV-Bilder zwischen den Pipelines. Für einen biologisch gültigen und robusten Index, der regionale Variationen in der grauen Substanz widerspiegelt, würde man eine hohe räumliche Homogenität sowie Reproduzierbarkeit über Pipelines hinweg erwarten. Allerdings ergaben die räumlichen Ähnlichkeitsanalysen erhebliche Unterschiede sowohl zwischen den Pipelines als auch innerhalb der Pipelines. Sowohl innerhalb als auch zwischen Pipelines bestand eine große Variabilität, aber insbesondere wiesen die mit CAT vorverarbeiteten Proben im Vergleich zu anderen Pipelines eine höhere Homogenität innerhalb der Teilnehmer auf (Abb. S2 und S3). Diese Ergebnisse legen nahe, dass die Wahl der Pipeline einen erheblichen Einfluss auf die räumliche Verteilung der GMV-Variationen hat und darüber hinaus beeinflusst, wie viel individuelle Variation nach der Vorverarbeitung der Daten erhalten bleibt. Die Untersuchung der Reproduzierbarkeit zwischen den Pipelines ergab eine allgemein schlechte Konsistenz, was auf eine geringe Reproduzierbarkeit zwischen den Pipelines zurückzuführen ist. Die zusätzliche Untersuchung der Reproduzierbarkeit auf Voxelebene deutete auf einige regionale Unterschiede mit besonders geringer Konsistenz zwischen den Pipelines im parietalen und frontalen Kortex hin (Abb. 2, Tabelle). S10). Darüber hinaus wurde eine hohe Variabilität zwischen den Beispieldatensätzen in der vorliegenden Studie beobachtet (z. B. reflektiert durch inkonsistente ICC-Karten und Pipeline-Leistungen zwischen Datensatz 1 und Datensatz 2). Dies spiegelt möglicherweise den potenziellen Einfluss verschiedener Aufnahmeprotokolle, MRT-Systeme und Populationsmerkmale wider und lässt auf komplexe Wechselwirkungen zwischen diesen Faktoren und der spezifischen Vorverarbeitungspipeline schließen. Zukünftige multizentrische Studien und Megaanalysen, die Daten aus verschiedenen Zentren bündeln, sind erforderlich, um diese komplexen Wechselwirkungen sorgfältig zu bewerten33.
Unser zweites Hauptziel bestand darin zu untersuchen, wie sich die Wahl der Pipeline und die Implementierung der Pipeline-spezifischen Standardkonfiguration auf die Ergebnisse einer typischen VBM-Studie auswirken würden. Im Hinblick auf GMV-Variationen und biologische Faktoren wurden Geschlecht und Alter in früheren Studien ausführlich untersucht. Obwohl sich die spezifischen Regionen, die GMV-Unterschiede zwischen Männern und Frauen aufweisen, zwischen den Studien unterscheiden, werden regionalspezifische Unterschiede häufig so interpretiert, dass sie geschlechtsspezifischen Unterschieden in den damit verbundenen kognitiven und emotionalen Funktionen zugrunde liegen8,9,10. In ähnlicher Weise zeigten frühere Erkenntnisse zu regionalspezifischen GMV-Veränderungen mit dem Alter inkonsistente Ergebnisse28,29 – selbst bei stark steigenden Stichprobengrößen9,10,37,38. Altersbedingte Veränderungen des GMV werden üblicherweise als atrophische Veränderungen interpretiert, die spezifische emotionale und kognitive Veränderungen mit dem Alter vermitteln. Im Gegensatz dazu deuten die vorliegenden Ergebnisse darauf hin, dass die spezifischen Regionen, die Geschlechtsunterschiede oder altersbedingte Veränderungen aufweisen, stark von der Wahl der Verarbeitungspipeline abhängen. Nach der Kontrolle des Einflusses statistischer Inferenz (dieselbe Statistiksoftware, siehe auch die Ähnlichkeit von Karten ohne Schwellenwert, Abb. 3 und 4) und Proben- oder Scannerunterschieden (derselbe Datensatz wurde in allen Pipelines verwendet) wurden beispielsweise nur wenige – oder bei Geschlechtsunterschieden wurden sogar keine (Abb. 3a, Tabelle 1) – überlappende Regionen identifiziert. Darüber hinaus überlappten sich bei den identifizierten GMV-Geschlechtsunterschieden keine drei Pipelines mehr als 20 Prozent, was auch die hohen regionalen Unterschiede widerspiegelte. Beispielsweise würden die Ergebnisse nach der Verarbeitung mit CAT auf ein höheres GM-Volumen bei Männern in limbischen Regionen hinweisen, die typischerweise mit emotionalen Prozessen oder räumlicher Navigation verbunden sind, wohingegen Ergebnisse für die FSL-basierte Pipeline auf GMV-Geschlechtsunterschiede in posterioren Parietalregionen hinweisen würden, die typischerweise mit Aufmerksamkeit oder räumlicher Navigation verbunden sind motorische Integration. In Bezug auf altersbedingte Veränderungen zeigten die Pipelines einige überlappende regionale GMV-Abnahmen im mittleren Gyrus occipitalis, obwohl diese im Allgemeinen gering waren (0,002 % bzw. 0,02 %, entsprechend parametrischer bzw. nichtparametrischer Statistik, Abb. 4a, S4, Tabelle 2). ). Im Allgemeinen unterschieden sich Ort, Ausmaß und Richtung der altersbedingten GMV-Änderungen zwischen den Pipelines erheblich. Während beispielsweise die Analyse mit CAT einen weit verbreiteten altersbedingten GMV-Rückgang in nahezu der gesamten Kortikalis ergab, zeigte FSLANAT stattdessen regionalspezifische Rückgänge in unteren Frontalregionen, während FSLVBM regionalspezifische altersbedingte GMV-Anstiege in Kleinhirn- und limbischen Regionen aufdeckte. Im Einklang mit einer aktuellen Studie, die den Einfluss von Pipelines auf die Ergebnisse der funktionellen Gehirnaktivierung untersuchte34, untersuchten wir zusätzlich räumliche Korrelationen zwischen den statistischen Karten ohne Schwellenwert. Obwohl in dieser früheren Studie eine beträchtliche Überlappung der Funktionskarten ohne Schwellenwert34 gemeldet wurde, war die Überlappung zwischen den Pipelines für die GMV-Karten in der vorliegenden Studie eher gering (Abb. 3 und 4), was bedeutet, dass die Auswirkungen der Pipeline zusätzlich je nach variieren Gehirnmodalität wird untersucht.
Zusätzlich zu massenunivariaten Analysen wurden auf maschinellem Lernen basierende Ansätze eingesetzt, um Geschlechtsunterschiede und altersbedingte Effekte aus der Perspektive der funktionalen und allgemeinen biologischen Validität zu untersuchen39,40. Kurz gesagt besteht die Grundidee darin, dass einige Merkmale, die aus den GMV-Karten abgeleitet werden können, erheblich zur genauen Vorhersage der biologischen Variablen Alter und Geschlecht beitragen. Insbesondere konnten auf der Grundlage aller GMV-Karten zuverlässige Merkmale für eine genaue Vorhersage der biologischen Variablen extrahiert werden (z. B. für das Alter alle Korrelationen > 0,8, Abb. 4d, für Geschlechtsklassifikatoren höher als das Zufallsniveau, Abb. 3e und S10). . Diese Ergebnisse legen nahe, dass alle Pipelines biologisch und funktionell relevante Informationen enthielten. Eine weitere Untersuchung der räumlichen Verteilung der aussagekräftigsten Voxel ergab jedoch erhebliche Unterschiede zwischen den vier Pipelines, ähnlich wie bei den massenunivariaten Analysen (Abb. 3d und 4c, Tabelle S11). Beispielsweise hätte die Anwendung von CAT-verarbeiteten Daten zur Entwicklung von Geschlechtsklassifikatoren den regionalspezifischen Beitrag des Putamen, des Hippocampus, des mittleren cingulären Kortex und des Gyrus angulär hervorgehoben, während FSLANAT darauf hingewiesen hätte, dass ein weit verbreitetes Muster eine erfolgreiche Geschlechtsklassifizierung ermöglichte. Schließlich hatte die Vorverarbeitungspipeline einen erheblichen Einfluss auf die Vorhersagegenauigkeit und die Vorhersageeffektgrößen, sodass unsere Geschlechtsklassifizierer je nach Pipeline eine Klassifizierungsgenauigkeit von 70–94 % in einem unabhängigen Datensatz erreichten. Dies weist darauf hin, dass die Verarbeitungspipeline einen erheblichen Einfluss auf die Sensitivität und Spezifität multivariater Vorhersagesignaturen haben kann.
Die Auswirkungen einer Reihe potenzieller Variabilitätsquellen wurden weiter untersucht, z. B. Vorlagen-, TIV- und Datenqualitätseffekte. Unsere Ergebnisse legen nahe, dass alle diese Faktoren zur Variabilität beitragen, aber selbst nach der Angleichung dieser Faktoren wurden erhebliche Unterschiede zwischen den Pipelines beobachtet. Zukünftige Studien sollten daher den Einsatz standardisierter Verfahren für diese Faktoren in Betracht ziehen (z. B. Replikation mit standardisierten Vorlagen, TIV und gründliche Datenqualitätsprüfungen, insbesondere Homogenitätsschätzungen).
Die größten Abweichungen wurden zwischen CAT und den anderen Pipelines beobachtet und blieben stabil, nachdem einige Variabilitätsquellen wie Template- und TIV-Effekte kontrolliert wurden. Die deutlichen Unterschiede können darauf zurückzuführen sein, dass die anderen drei Pipelines auf FSL basierten oder FSL-basierte Module enthielten (die in sMRIPrep implementierte modulare interne Pipeline enthielt FSL-Funktionen für räumliche Normalisierung und Modulation), während CAT unterschiedliche Routinen verwendet. CAT nutzt beispielsweise die einheitliche Segmentierung von SPM für die Erstregistrierung und optimiert anschließend die Segmentierung mit anderen erweiterten Optionen. Dies fördert möglicherweise homogenere GMV-verarbeitete Bilder und hat sowohl zu einer höheren Homogenität innerhalb der von CAT verarbeiteten Datensätze als auch zu den deutlichen Unterschieden zwischen den Pipelines zwischen CAT und den anderen Pipelines beigetragen. Darüber hinaus erstellen und verwenden die FSL-basierten Pipelines studienspezifische Vorlagen zur Normalisierung, während CAT eine vorab festgelegte Vorlage verwendet. Die durch die Berechnung einer studienspezifischen Vorlage verursachte Variabilität könnte die Unterschiede zwischen den Pipelines weiter verstärken. Während die Variabilität zwischen den Pipelines nach Verwendung derselben Vorlage sowohl in univariaten als auch in multivariaten Analysen stabil blieb (siehe Ergänzungen), können wir nicht ausschließen, dass Unterschiede in den Normalisierungsvorlagen zu Variabilität in pathologischen Proben mit Veränderungen der Gehirnstruktur führen können. Im Hinblick auf multivariate Analysen beobachteten wir auch Unterschiede zwischen den Pipelines; Beispielsweise ergaben die Daten der sMRIPrep-Pipeline selbst mit einer konstanten Vorlage nur eine vergleichsweise geringe Vorhersagegenauigkeit, was möglicherweise auf eine geringe interne Konsistenz in Datensatz 1 bei der Verarbeitung durch die sMRIPrep-Pipeline zurückzuführen ist (siehe Abb. S3). Schließlich empfehlen CAT und FSL unterschiedliche Strategien zur Modulation von Daten, d. h. affine + nichtlineare und nichtlineare reine Modulation, was möglicherweise zu Variabilität zwischen den Pipelines geführt hat. Der genaue Einfluss der Modulation wurde in früheren Studien für Pipeline-Szenarien untersucht, siehe z. B. Lit. 41,42.
Unsere Ergebnisse stellen die Reproduzierbarkeit sowie die biologische und funktionelle Interpretierbarkeit regionaler GMV-Variationen gemäß VBM in Frage. Die Wahl der Software hatte einen erheblichen Einfluss auf die regionale Variation des GMV auf Voxelebene, die schwer mit einem biologisch gültigen Index in Einklang zu bringen ist. Darüber hinaus unterschieden sich die Regionen, in denen Geschlechtsunterschiede oder altersbedingte GMV-Veränderungen festgestellt wurden, je nach verwendeter Pipeline stark. Die hohe Variabilität in den identifizierten Regionen hätte zu einer recht unterschiedlichen funktionellen Interpretation von Geschlechtsunterschieden (z. B. Abb. 3c) sowie zu atrophischen Veränderungen mit dem Alter und möglichen funktionellen Konsequenzen geführt. Im Gegensatz dazu haben multivariate Analysen Alter und Geschlecht mit Klassifikatoren, die auf GMV-Karten aus allen Pipelines trainiert wurden, genau vorhergesagt; Die spezifischen Vorhersageregionen waren jedoch unterschiedlich. Zusammengenommen deuten diese Ergebnisse darauf hin, dass GMV-Indizes biologisch relevante Informationen kodieren, die Interpretation spezifischer Regionen sowohl in univariaten als auch in multivariaten Analysen jedoch weitgehend von der Pipeline abhängt. Im Kontext der Replizierbarkeitskrise gelten Metaanalysen von Neuroimaging-Daten als Goldstandard. Unsere aktuellen Ergebnisse deuten jedoch darauf hin, dass koordinatenbasierte Metaanalysen möglicherweise auch die regionale Variabilität zwischen Studien berücksichtigen müssen, die durch die Verwendung verschiedener Pipelines entsteht.
Die vorliegenden Ergebnisse unterstreichen die Notwendigkeit einer detaillierten Berichterstattung über die Softwarespezifikationen und -konfigurationen, was auch im Bericht des Committee on Best Practices in Data Analysis and Sharing (COBIDAS)43 befürwortet wird. Die Tatsache, dass die Pipelines mit empfohlenen Standardkonfigurationen erheblich unterschiedliche GMV-Ergebnisse ergaben, deutet jedoch darauf hin, dass weitere Anstrengungen erforderlich sind, um die Entwicklung robuster und reproduzierbarer GMV-basierter Biomarker zu fördern34,44,45. Mögliche erste Schritte sind offene Kooperations- und Replizierbarkeitsanalysen über Softwareplattformen und Pipelines hinweg, offene Softwareplattformen, die Vergleiche und Standardisierung von Methoden über Plattformen hinweg ermöglichen, und ein transparenter und detaillierter Verarbeitungsbericht, der Manuskripteinreichungen begleiten sollte (z. B. wie von sMRIPrep und fMRIPrep bereitgestellt). . Weitere Analysen, die die Auswirkungen der Normalisierungsvorlage, der TIV-Berechnung und der Datenqualität im Hinblick auf die Probenhomogenität untersuchten, ergaben, dass die Variabilität zwischen Pipelines robust blieb, wenn Vorlage und TIV über Pipelines hinweg ausgerichtet wurden. Im Gegensatz dazu reduzierte die Qualitätskontrolle der vorverarbeiteten Bilder durch den Ausschluss von Bildern mit geringer räumlicher Ähnlichkeit die Variabilität zwischen den Pipelines in gewissem Maße. Diese Ergebnisse deuten darauf hin, dass eine Verbesserung der Datenhomogenität die Reproduzierbarkeit über Pipelines hinweg verbessern kann. Allerdings wurden je nach Pipeline unterschiedliche Bilder aufgrund der Probenhomogenität ausgeschlossen. Darüber hinaus schränkt das Fehlen eines Goldstandards für analytische Flexibilität bei der Neuroimaging-Metaanalyse und das Fehlen einer Grundwahrheit für VBM-Indizes den Vergleich zwischen Pipelines ein. Beispielsweise können Pipelines eine hohe Reproduzierbarkeit innerhalb der Pipeline aufweisen. Die aktuelle Arbeit erlaubt es uns jedoch nicht anzugeben, welche der identifizierten Regionen tatsächlich positive Ergebnisse darstellen. Trotz dieser Einschränkung zeigt die vorliegende Arbeit, dass die Wahl einer bestimmten VBM-Pipeline einen starken Einfluss auf die Ergebnisse hat, die für dieselbe Forschungsfrage erzielt werden. Um echte positive Ergebnisse und die biologische Plausibilität der VBM-Technik weiter zu bestimmen, ist ein Benchmarking mit klaren biologischen Indizes aus Tiermodellen, postmortalen Gehirnindizes oder invasiven Ansätzen erforderlich. Obwohl sich die vorliegende Studie hauptsächlich auf die anfängliche Untersuchung der durch die verschiedenen VBM-Pipelines eingeführten Variabilität konzentriert, wurde in einer Reihe neuerer Studien die Zuverlässigkeit von Gehirnstrukturmessungen, einschließlich VBM, innerhalb der Pipeline über verschiedene Zeitpunkte hinweg untersucht 46, 47, 48, 49. Diese Studien berichteten im Allgemeinen über eine gute bis ausgezeichnete VBM-Zuverlässigkeit innerhalb der Pipeline, obwohl sie durch Teilnehmermerkmale wie Geschlecht oder das Vorliegen einer Störung beeinflusst wurde. Eine kürzlich durchgeführte Studie untersuchte die Variabilität zwischen Pipelines für die funktionelle MRT und verwendete einen dicht abgetasteten Test-Retest-Datensatz zur Auswertung50, ein Ansatz, der die Identifizierung von Wechselwirkungen zwischen der Variabilität zwischen Pipelines und wiederholten Bewertungen in zukünftigen Studien zu VBM ermöglichen würde. Darüber hinaus beziehen sich die verschiedenen Softwarepakete zwar auf allgemeine Vorverarbeitungsschritte wie „Segmentierung“ oder „räumliche Normalisierung“, Details in der Implementierung können jedoch zu sehr unterschiedlichen Ergebnissen führen. Es wird notwendig sein, automatische Qualitätskontrolltools zu erforschen und einen übergreifenden und modularen Arbeitsablauf zu etablieren, um die Robustheit von VBM-Analysen zu verbessern.
Die vorliegende Studie zeigte erhebliche Unterschiede in den GMV-Indizes und entsprechenden Ergebnissen in den am häufigsten verwendeten Verarbeitungspipelines für VBM. Die Kombination aus massenunivariaten Analysen und auf maschinellem Lernen basierenden multivariaten Ansätzen ergab, dass die spezifischen Regionen, die GMV-Geschlechtsunterschiede oder altersbedingte Veränderungen aufwiesen, je nach gewählter Software stark variierten. Während über Pipelines hinweg eine multivariate Vorhersage von Geschlecht und Alter möglich war, schwankte die Vorhersagegenauigkeit zwischen ihnen stark. Zusammengenommen stellen diese Ergebnisse die Interpretierbarkeit und Robustheit der VBM-Ergebnisse in Frage.
Datensatz 1 umfasste T1-gewichtete anatomische Daten von 200 gesunden chinesischen Teilnehmern im Alter von 18–26 Jahren (Mittelwert = 21,45 Jahre, SD = 2,18; 100 Frauen und 100 Männer im Alter übereinstimmend; Probendetails siehe auch Liu et al.51) . Dieser Datensatz diente dazu, Variationen zwischen den vier Analysepipelines im Hinblick auf die Bestimmung von Unterschieden in der grauen Substanz in Zwischensubjektdesigns am Beispiel von Geschlechtsunterschieden zu bestimmen.
Datensatz 2 umfasste 494 gesunde chinesische Teilnehmer im Alter von 19–80 Jahren (Mittelwert = 45,18 Jahre, SD = 17,44, 187 Männer) aus einem offen verfügbaren Datensatz (SALD), der T1-gewichtete anatomische und funktionelle MRT-Daten im Ruhezustand umfasste (Details siehe Ref . 52). Dieser Datensatz diente dazu, Variationen zwischen den Softwarepaketen im Hinblick auf lineare Zusammenhänge zwischen biologischen Indizes und GMV am Beispiel altersbedingter Veränderungen zu bestimmen. Detaillierte strukturelle MRT-Erfassungsparameter finden Sie unter „Ergänzende Methoden“.
Zunächst untersuchten wir sichtbare Artefakte und die Bildqualität durch eine visuelle Inspektion, die eine hohe Bildqualität bestätigte. Zweitens wurde eine automatisierte Qualitätsbewertung durch die MRIQC-Toolbox (https://mriqc.readthedocs.io/)53 eingesetzt, um die Rohdatenqualität weiter zu bewerten, einschließlich des Signal-Rausch-Verhältnisses (SNR) und des Vordergrund-Hintergrund-Energieverhältnisses (FBER). , Prozent der Artefaktvoxel (Qi1) (Details und Ergebnisse siehe ergänzende Materialabbildungen S11 und S12 sowie Wei et al.52). Drittens wurde das Qualitätssicherungs-(QA)-Framework CAT12.7 (r1720) (http://www.neuro.uni-jena.de/cat/) zur empirischen Quantifizierung von Qualitätsunterschieden zwischen Scans und Studien angewendet. Diese retrospektive Qualitätssicherung ermöglicht die Bewertung wesentlicher Bildparameter wie Rauschen, Inhomogenitäten und Bildauflösung, die in einen einzigen Qualitätsindex integriert werden können (Datensatz 1: Mittelwert = 81,68, SD = 1,61, Bereich = 73,48–84,48; Datensatz 2: Mittelwert). = 84,51, SD = 1,27, Bereich = 76,9–86,24; Werte >70 bedeuten eine zufriedenstellende bis ausgezeichnete Bildqualität. Somit haben alle Daten das Qualitätskontrollverfahren bestanden.
VBM-Analysen ermitteln im Allgemeinen zwei Arten von Strukturindizes, die als Volumen und Konzentration bezeichnet werden, je nachdem, ob ein Modulationsschritt verwendet wird oder nicht37,54,55. Im Einklang mit den Vorteilen und der breiteren Verwendung modulierter Bilder (Volumen) konzentrierten sich alle nachfolgenden Analysen auf modulierte Daten.
In Bezug auf die Vorverarbeitungspipelines haben wir vier separate Vorverarbeitungspipelines eingerichtet. Diese Pipelines implementierten eine voxelweise Schätzung des lokalen GMV. Da das Hauptziel unserer Studie darin bestand, die durch die Verwendung häufig verwendeter VBM-Pipelines verursachte Variabilität zu untersuchen, wurden die vier Pipelines gemäß den Standard- oder empfohlenen Konfigurationen in den jeweiligen Handbüchern der Softwarepakete eingerichtet (Abb. 1). Eine Pipeline basierte auf CAT12.7 (r1720) (http://www.neuro.uni-jena.de/cat/) (CAT); Zwei Pipelines basierten auf FSL v6.0 (https://fsl.fmrib.ox.ac.uk/fsl/fslwiki/FSL, Smith et al.56, Jenkinson et al.57) (FSLVBM bzw. FSLANAT); und eine Pipeline enthielt Module aus verschiedenen Softwarepaketen und basierte auf sMRIPrep 0.6.2 (Esteban et al.58, RRID:SCR_016216, https://www.nipreps.org/smriprep/) (sMRIPrep).
Die CAT-Pipeline wurde in CAT12.7 implementiert, das auf SPM12 v7219 läuft (Welcome Department of Cognitive Neurology, London, UK, https://www.fil.ion.ucl.ac.uk/spm/software/spm12/). In der Pipeline wurden standardmäßige VBM-Vorverarbeitungsprotokolle von CAT12 verwendet, wie im CAT12.7-Handbuch beschrieben. Kurz gesagt, die T1-gewichteten Bilder wurden voreingenommen korrigiert und in graue Substanz (GM), weiße Substanz (WM) und Liquor cerebrospinalis (CSF) segmentiert, wobei die einheitliche Segmentierungsfunktion von SPM für die Segmentierung und Erstregistrierung verwendet wurde, mit zusätzlicher Optimierung der Segmentierung ( B. unter Verwendung lokaler adaptiver Segmentierung und adaptiver maximaler a-posteriorer Segmentierung) und räumlich auf den Standardraum des Montreal Neurological Institute (MNI) normalisiert, unter Verwendung der ICBM-152-Vorlage (ostasiatisch, zusätzliche Ergebnisse, die mit der kaukasischen Vorlage erhalten wurden, hatten keinen Einfluss auf die Ergebnisse, siehe Ergänzungen). Abb. S13) mit einer Voxelgröße von 2 × 2 × 2 mm. GM-Bilder wurden mit drei Gaußschen Kerneln mit üblicherweise verwendeten Glättungskernen (8, 10 und 12 mm) bei voller Breite bei halbem Maximum (FWHM) für die anschließende statistische Analyse geglättet und das gesamte intrakranielle Volumen (TIV) wurde geschätzt, um individuelle Unterschiede zu korrigieren Gehirngröße. Sofern nicht anders angegeben, wurden Standardparameter angewendet.
In FSL56,57 wurden zwei verschiedene Standard-Vorverarbeitungspipelines eingerichtet: (1) FSLVBM (https://fsl.fmrib.ox.ac.uk/fsl/fslwiki/FSLVBM) und (2) FSLANAT (https://fsl. fmrib.ox.ac.uk/fsl/fslwiki/fsl_anat). Die FSLVBM-Standardpipeline umfasste die folgenden vier Schritte: Zunächst wurde Nicht-Gehirngewebe mithilfe von BET (fslvbm_1_bet) entfernt. Zweitens (fslvbm_2_template) wurde eine Gewebetypsegmentierung über das Automated Segmentation Tool (FAST) durchgeführt, um die Bilder in GM, WM und CSF zu segmentieren. Drittens wurden die Ergebnisse mithilfe des Registrierungstools FNIRT nichtlinear in der GM ICBM-152-Vorlage registriert und anschließend eine studienspezifische Vorlage erstellt. Schließlich wurden die GM-Bilder mithilfe von FNIRT (fslvbm_3_proc) nichtlinear in der studienspezifischen Vorlage registriert. Im Gegensatz dazu ist FSLANAT eine allgemeine Pipeline zur Verarbeitung anatomischer Bilder, die die folgenden Schritte umfasst (fsl_anat). Bemerkenswert ist, dass sich die Verarbeitungsreihenfolge von FSLVBM unterscheidet und die Endergebnisse segmentierte Daten im nativen Bereich sind. Zunächst wurden alle T1-gewichteten Bilder auf die Standard-MNI-Ausrichtung umorientiert (fslreorient2std) und automatisch zugeschnitten (robustfov). Zweitens wurde eine Bias-Field-Korrektur zur RF/B1-Inhomogenitätskorrektur (FAST) durchgeführt. Drittens führte die Pipeline eine Gehirnextraktion (BET) und eine Gewebetypsegmentierung (FAST) durch. Die Berechnung des TIV für FSLANAT und FSLVBM erfolgte gemäß den Protokollen des ENIGMA-Projekts (http://enigma.ini.usc.edu/protocols/imaging-protocols/protocol-for-brain-and-intracranial-volumes/# fsl).
sMRIPrep 0.6.2 (Esteban, et al.58, RRID:SCR_016216, https://www.nipreps.org/smriprep/) ist eine strukturelle MRT-Datenvorverarbeitungspipeline, die entwickelt wurde, um eine leicht zugängliche, hochmoderne Lösung bereitzustellen Schnittstelle, die robust gegenüber Variationen in Scan-Erfassungsprotokollen ist und nur minimale Benutzereingaben erfordert, während sie gleichzeitig leicht interpretierbare und umfassende Fehler- und Ausgabeberichte bietet. Der Workflow basiert auf Nipype 1.5.0 (Gorgolewski, et al.59, RRID:SCR_002502). Ein ähnlicher Workflow wird auch im anatomischen Vorverarbeitungsworkflow von fMRIPrep verwendet (Esteban et al.58, https://fmriprep.org/). In der vorliegenden Studie wurde das T1-gewichtete (T1w) Bild mit N4BiasFieldCorrection60 auf Intensitätsungleichmäßigkeit (INU) korrigiert, mit ANTs 2.2.0 verteilt (Avants et al.61, RRID:SCR_004757) und als T1w-Referenz verwendet im gesamten Arbeitsablauf. Die T1w-Referenz wurde dann mit einer Nipype-Implementierung des antsBrainExtraction.sh-Workflows (von ANTs) entkernt, wobei OASIS30ANTs als Zielvorlage verwendet wurde. Die Hirngewebesegmentierung von CSF, WM und GM wurde an dem aus dem Gehirn extrahierten T1w mit Fast durchgeführt (FSL 5.0.9, RRID:SCR_002823, Zhang et al.62). Da sMRIPrep keine TIV-Schätzung liefert, wurde die entsprechende Gehirngröße für die Analyse durch Zusammenfassung der Gewebetypen (GM + WM + CSF) berechnet.
Um weitere durch räumliche Normalisierung verursachte Variabilität zu reduzieren, verwendeten die FSLANAT-, FSLVBM- und sMRIPrep-Pipelines dieselbe Normalisierung. Im Detail wurden sMRIPrep und FSLANAT hauptsächlich zur Segmentierung von GM-, WM- und CSF-Daten verwendet, und die Daten wurden anschließend in die FSLVBM-Pipeline integriert. Für die Verarbeitung in diesen Pipelines haben wir daher die anfänglichen Phasen der Gehirnextraktion (fslvbm_1_bet) und der Segmentierung (erster Teil von fslvbm_2_template) ausgeschlossen und die segmentierten GM-Ergebnisse (im nativen Raum) fslvbm_2_template und fslvbm_3_proc unterzogen, um modulierte GM-Daten zu erzeugen.
Um die Vorverarbeitung innerhalb jeder Plattform konsistent zu halten, wurde die fslmaths-Funktion verwendet, um FSL-verarbeitete Daten (FSLVBM, FSLANAT und sMRIPrep) mit vergleichbaren Glättungskernen (Sigma = 3,5, 4,3, 5,2, was ungefähr FWHM entspricht – 3,5 × 2,3 = 8,05 ≈ 8) zu glätten , 4,3 × 2,3 = 9,89 ≈ 10 und 5,2 × 2,3 = 11,96 ≈ 12) als CAT-Daten. Für die CAT-Vorverarbeitung wurde eine SPM-Glättung mit FWHM = 8, 10 bzw. 12 durchgeführt.
Zusammenfassend lässt sich sagen, dass die vier Pipelines je nach den zur Verarbeitung der Daten verwendeten Funktionen in drei FSL-basierte (FSLANAT, FSLVBM und sMRIPrep, die die Segmentierungsfunktion FAST von FSL verwenden) und CAT-basierte Pipelines unterteilt werden können. Innerhalb der FSL-basierten Pipelines verwendete FSLVBM die weitere Verarbeitung nach der Segmentierung, während FSLANAT eine andere Reihenfolge der Verarbeitungsschritte verwendete. Die sMRIPrep-Pipeline stellt eine interne Pipeline dar, die auf verschiedenen Neuroimaging-Paketen basiert, darunter FSL, Nipype, ANTs usw. CAT verwendete funktionell ähnliche Schritte wie Bias-Korrektur, Segmentierung, räumliche Normalisierung, Glättung und Modulation, diese Schritte basierten jedoch auf CAT-spezifische statt FSL-basierte Verarbeitungsansätze. Darüber hinaus umfasst CAT zusätzliche Schritte wie die durch SPM12 implementierte einheitliche Segmentierung und weitere Optimierungsschritte wie Entrauschen. Die verschiedenen Verarbeitungsschritte und -funktionen können zu Abweichungen bei der Datenvorverarbeitung und den statistischen Ergebnissen führen. Bemerkenswert ist, dass unser Hauptaugenmerk darauf lag, Unterschiede zu ermitteln, die sich aus der Anwendung der standardmäßigen oder empfohlenen Verarbeitungsschritte innerhalb der verschiedenen Pipelines ergeben können, anstatt die technischen Details, die zu der Variabilität führen, gezielt zu trennen.
Pearsons Korrelationskoeffizienten wurden verwendet, um die räumliche Ähnlichkeit der modulierten GM-Karten der vorverarbeiteten Daten aus den vier Pipelines für Datensatz 1 (männlich und weiblich) und Datensatz 2 sowie bei verschiedenen Glättungskernen zu berechnen (siehe Abb. S2). Zur Darstellung der Verteilung wurden räumliche Ähnlichkeitskarten über die Verarbeitungspipelines erstellt (Abb. S2) und zeigten sehr ähnliche Muster in den ungeglätteten Daten und den mit drei verschiedenen Glättungskernen (FWHM 8, 10 und 12) verarbeiteten Daten. Weitere statistische Analysen konzentrierten sich daher auf die z-transformierten r-Werte der geglätteten FWHM 8-Daten. Die Untersuchung der räumlichen Ähnlichkeit innerhalb der Pipeline-Ähnlichkeiten mittels ANOVA-Modellen ergab einen signifikanten Haupteffekt der Pipeline, insbesondere eine hohe räumliche Ähnlichkeit innerhalb der von der CAT-Pipeline verarbeiteten Daten und eine hohe Variation zwischen Pipelines (Abb. S3, ungeglättete Daten). siehe Abb. S14) für beide Datensätze 1 und 2 (Bonferroni korrigierte p < 0,01).
Die Replikationsfähigkeit über Pipelines hinweg wurde mithilfe von zwei Ansätzen bewertet: (1) Die univariate Reproduzierbarkeit auf Voxelebene wurde mithilfe des Intraclass-Korrelationskoeffizienten (ICC) untersucht, der durch ein lineares gemischtes Modell in DPABI63 implementiert wurde, siehe ergänzendes Material, und (2) die multivariate Reproduzierbarkeit im gesamten Gehirn. unter Verwendung des Bild-Intraklassen-Korrelationskoeffizienten (I2C2), der ein multivariates Bildmessfehlermodell darstellt5. ICC (ICC (3,1) mit linearen gemischten Modellen, wie in der aktuellen Studie verwendet) und I2C2 können die Konsistenz zwischen den verschiedenen Pipelines auf Voxel- bzw. Gesamthirnebene abschätzen5,64. Die anhand des Koeffizienten bewertete Reproduzierbarkeit zwischen den Pipelines wird üblicherweise wie folgt interpretiert: <0,4 schlecht; 0,4–0,59 mittelmäßig; 0,60–0,74 gut; >0,74 ausgezeichnet64,65,66.
Um mögliche Wechselwirkungen zwischen Vorverarbeitung und inferenzstatistischen Verfahren zu berücksichtigen, wurden alle univariaten Analysen in der aktuellen Studie in SPM12 und über verschiedene Mehrfachvergleichskorrekturen hinweg durchgeführt. Die Analysen umfassen konventionelle statistische Parametertests (Schwellenwert auf Voxelebene p < 0,001 und Clusterebene pFWE < 0,05 mit anfänglicher Clusterbildungsvoxelebene p < 0,001) sowie schwellenfreie Clusterverbesserung (TFCE mit 5.000 Permutationen, Schwelle bei p < 0,001 bzw. pFWE < 0,05). Der Vollständigkeit halber sind die unkorrigierten Ergebnisse auf Voxelebene (p < 0,001 und TFCE p < 0,001) in den ergänzenden Materialabbildungen aufgeführt. S15 und S16 sowie Ergebnisse nach Ausschluss des Template-Effekts und der TIV-Berechnung in Abb. S17.
Unabhängige Stichproben-T-Tests wurden eingesetzt, um signifikante Unterschiede im regionalen Volumen der grauen Substanz zwischen Männern und Frauen zu bestimmen. Alter und TIV wurden in die Modelle einbezogen, wie für VBM-Analysen empfohlen, um alters- und globale Variationen der Gehirngröße zu kontrollieren.
Mehrere lineare Regressionsmodelle wurden eingesetzt, um Zusammenhänge zwischen Alter und regionalem GMV zu untersuchen, einschließlich Geschlecht und TIV als Kovariaten.
Um zu untersuchen, ob die Verwendung der verschiedenen Pipelines die Vorhersagegenauigkeit von Geschlecht und Alter durch verteilte Strukturvariationen des Gehirns (GMV-Karten) beeinflusst, wurde ein hochmodernes Framework für maschinelles Lernen im Neuroimaging40 eingesetzt. Für die kategoriale Vorhersage (Geschlecht) wurden die 200 gesunden Teilnehmer aus Datensatz 1 in zwei geschlechts- und altersangepasste unabhängige Stichproben aufgeteilt, die als Trainings- bzw. Testdatensätze dienten. Zur Entwicklung eines MVPA-basierten Geschlechtsklassifikators wurde eine Support-Vektor-Maschine (SVM, C = 1) eingesetzt. Die SVM wurde anhand der Trainingsdaten (n = 100) mit einem Bootstrapping-Test trainiert, um stabile Merkmale zu finden (5000 Permutationen, pFDR < 0,05). Anschließend wurden diese Features genutzt, um das Modell mittels fünffacher Kreuzvalidierung zu trainieren. Die resultierenden Muster wurden anschließend in der unabhängigen Teststichprobe (n = 100) getestet, um die Vorhersagegenauigkeit für das Geschlecht innerhalb und zwischen Pipelines zu bestimmen. Um die Effektgröße jeder Klassifizierung abzuschätzen, wurde Cohens d für Zwischen-Subjekt-Designs verwendet67. Zur Vorhersage einer kontinuierlichen Variablen (Alter) wurde ein Support-Vector-Regressionsmodell (SVR, Epsilon = 0,1, C = 1) auf Datensatz 2 trainiert. Ein Bootstrapping-Test (5000 Permutationen, pFDR < 0,05) wurde verwendet, um stabile Merkmale zu finden. Diese Funktionen und eine fünffache Kreuzvalidierung wurden angewendet, um das Modell zu trainieren. Als nächstes wurde die Vorhersageleistung durch Auswertung der Korrelationsstärken zwischen dem vorhergesagten und dem tatsächlichen Alter für innerhalb und zwischen Pipelines quantifiziert. Eine stabile vorhergesagte Leistung nach Ausschluss des Template-Effekts und stabile vorhergesagte Muster wurden ebenfalls in den Abbildungen bereitgestellt. S18 und S19.
Bemerkenswert ist, dass das Ziel des MVPA nicht darin bestand, einen optimierten Algorithmus oder Funktionsumfang zur Vorhersage von Geschlecht oder Alter zu bestimmen, sondern vielmehr festzustellen, ob unterschiedliche Verarbeitungspipelines die Vorhersagegenauigkeit beeinflussen und ob die GMV-Karten im Allgemeinen biologisch bedeutsame Informationen kodieren.
Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Research Reporting Summary.
Statistische Karten ohne Schwellenwert und Mustergewichtsbilder sind auf OSF (https://osf.io/p5b6f/) verfügbar. Datensatz 2 steht in einem Amazon Web Services S3-Bucket von der International Data-sharing Initiative (http://fcon_1000.projects.nitrc.org/indi/s3/index.html) unter einer Creative Commons-Lizenz zum Download zur Verfügung: Namensnennung Nicht Kommerziell. Weitere Daten können auf begründete Anfrage bei den entsprechenden Autoren eingeholt werden.
Poldrack, RA et al. Den Horizont abtasten: Auf dem Weg zu einer transparenten und reproduzierbaren Neuroimaging-Forschung. Nat. Rev. Neurosci. 18, 115–126 (2017).
Artikel CAS PubMed PubMed Central Google Scholar
Buimer, EEL et al. Die YOUth-Kohortenstudie: MRT-Protokoll und Test-Retest-Zuverlässigkeit bei Erwachsenen. Entwickler Cogn. Neurosci. 45, 100816 (2020).
Artikel PubMed PubMed Central Google Scholar
Madan, CR & Kensinger, EA Test-Retest-Zuverlässigkeit von Schätzungen der Gehirnmorphologie. Gehirn-Inf. 4, 107–121 (2017).
Artikel Google Scholar
Melzer, TR et al. Test-Retest-Zuverlässigkeit und Schätzungen der Stichprobengröße nach dem Umzug des MRT-Scanners. Neuroimage 211, 116608 (2020).
Artikel PubMed Google Scholar
Shou, H. et al. Quantifizierung der Zuverlässigkeit von Bildreplikationsstudien: der Bild-Intraklassen-Korrelationskoeffizient (I2C2). Cogn. Verhalten beeinflussen. Neurosci. 13, 714–724 (2013).
Artikel CAS PubMed PubMed Central Google Scholar
Elliott, ML et al. Wie hoch ist die Test-Retest-Zuverlässigkeit gängiger aufgabenfunktionaler MRT-Messungen? neue empirische Erkenntnisse und eine Metaanalyse. Psychol. Wissenschaft. 31, 792–806 (2020).
Artikel PubMed PubMed Central Google Scholar
Becker, B. et al. Kleinere Amygdala und medialer präfrontaler Kortex sagen einen zunehmenden Stimulanzienkonsum voraus. Gehirn 138, 2074–2086 (2015).
Artikel PubMed Google Scholar
Ruigrok, AN et al. Eine Metaanalyse der Geschlechtsunterschiede in der menschlichen Gehirnstruktur. Neurosci. Biobehav Rev. 39, 34–50 (2014).
Artikel PubMed PubMed Central Google Scholar
Ritchie, SJ et al. Geschlechtsunterschiede im erwachsenen menschlichen Gehirn: Beweise von 5216 britischen Biobank-Teilnehmern. Großhirn. Cortex 28, 2959–2975 (2018).
Artikel PubMed PubMed Central Google Scholar
Lotze, M. et al. Neuartige Erkenntnisse aus 2.838 erwachsenen Gehirnen zu geschlechtsspezifischen Unterschieden im Gehirnvolumen der grauen Substanz. Wissenschaft. Rep. 9, 1671 (2019).
Artikel PubMed PubMed Central CAS Google Scholar
Zhou, X. et al. Ein höheres Maß an Symptomen einer (Internet-)Spielstörung geht laut WHO- und APA-Rahmen mit einem geringeren Striatumvolumen einher. J. Verhalten. Süchtig. 9, 598–605 (2020).
Artikel PubMed PubMed Central Google Scholar
Taubert, M., Lohmann, G., Margulies, DS, Villringer, A. & Ragert, P. Langzeiteffekte des motorischen Trainings auf Ruhezustandsnetzwerke und die zugrunde liegende Gehirnstruktur. Neuroimage 57, 1492–1498 (2011).
Artikel PubMed Google Scholar
Miller, KL et al. Multimodale Bildgebung des Populationsgehirns in der prospektiven epidemiologischen Studie der britischen Biobank. Nat. Neurosci. 19, 1523–1536 (2016).
Artikel CAS PubMed PubMed Central Google Scholar
Nostro, AD, Muller, VI, Reid, AT & Eickhoff, SB Korrelationen zwischen Persönlichkeit und Gehirnstruktur: eine entscheidende Rolle des Geschlechts. Großhirn. Cortex 27, 3698–3712 (2017).
PubMed Google Scholar
Llera, A., Wolfers, T., Mulders, P. & Beckmann, CF Interindividuelle Unterschiede in der Struktur und Morphologie des menschlichen Gehirns hängen mit Variationen in Demografie und Verhalten zusammen. Elife https://doi.org/10.7554/eLife.44443 (2019).
Zhao, Z. et al. Das Putamen-Volumen sagt den Lernerfolg von fMRT-Neurofeedback in Echtzeit über Paradigmen und Neurofeedback-Zielregionen hinweg voraus. Summen. Brain Mapp. 42, 1879–1887 (2021).
Artikel PubMed PubMed Central Google Scholar
Wang, Q. et al. Dissoziierte neuronale Substrate, die impulsiver Entscheidung und impulsivem Handeln zugrunde liegen. Neuroimage 134, 540–549 (2016).
Artikel PubMed Google Scholar
Premi, E. et al. Auf der Suche nach Neuroimaging-Markern in klinischen Studien zur frontotemporalen Lappendegeneration: eine Multi-Voxel-Musteranalysestudie bei Granulinerkrankungen. J. Alzheimers Dis. 51, 249–262 (2016).
Artikel CAS PubMed Google Scholar
Solana-Lavalle, G. & Rosas-Romero, R. Klassifizierung von PPMI-MRT-Scans mit voxelbasierter Morphometrie und maschinellem Lernen zur Unterstützung der Diagnose der Parkinson-Krankheit. Rechenmethoden Prog. Biomed. 198, 105793 (2021).
Artikel Google Scholar
Kharabian Masouleh, S. et al. Einfluss der Verarbeitungspipeline auf die Messung der kortikalen Dicke. Großhirn. Cortex 30, 5014–5027 (2020).
Artikel PubMed PubMed Central Google Scholar
Popescu, V. et al. Atrophie der grauen Substanz bei Multipler Sklerose: Die klinische Interpretation hängt von der Wahl der Analysemethode ab. PLoS ONE 11, e0143942 (2016).
Artikel PubMed PubMed Central CAS Google Scholar
Rajagopalan, V. & Pioro, EP Unterschiedliche voxelbasierte Morphometrie (VBM)-Ergebnisse zwischen SPM- und FSL-Software bei ALS-Patienten mit frontotemporaler Demenz: Welche VBM-Ergebnisse sollten berücksichtigt werden? BMC Neurol. 15, 32 (2015).
Artikel PubMed PubMed Central Google Scholar
Pepe, A., Dinov, I. & Tohka, J. Ein automatischer Rahmen für die quantitative Validierung voxelbasierter Morphometriemessungen der anatomischen Gehirnasymmetrie. Neuroimage 100, 444–459 (2014).
Artikel PubMed Google Scholar
Bookstein, FL „Voxelbasierte Morphometrie“ sollte nicht bei unvollständig registrierten Bildern verwendet werden. Neuroimage 14, 1454–1462 (2001).
Artikel CAS PubMed Google Scholar
Senjem, ML, Gunter, JL, Shiung, MM, Petersen, RC & Jack, CR Jr. Vergleich verschiedener methodischer Implementierungen der Voxel-basierten Morphometrie bei neurodegenerativen Erkrankungen. Neuroimage 26, 600–608 (2005).
Artikel PubMed Google Scholar
Mechelli, A., Friston, KJ, Frackowiak, RS & Price, CJ Strukturelle Kovarianz im menschlichen Kortex. J. Neurosci. 25, 8303–8310 (2005).
Artikel CAS PubMed PubMed Central Google Scholar
Shen, S., Szameitat, AJ & Sterr, A. Die Erkennung von VBM-Läsionen hängt von der Normalisierungsvorlage ab: eine Studie mit simulierter Atrophie. Magn. Reson Imaging 25, 1385–1396 (2007).
Artikel PubMed Google Scholar
Kharabian Masouleh, S., Eickhoff, SB, Hoffstaedter, F., Genon, S. & Alzheimer's Disease Neuroimaging, I. Empirische Untersuchung der Reproduzierbarkeit von Zusammenhängen zwischen Gehirnstruktur und psychologischen Variablen. Elife https://doi.org/10.7554/eLife.43464 (2019).
Fjell, AM et al. Beschleunigte kortikale Ausdünnung: einzigartig bei Demenz oder universell beim Altern. Großhirn. Cortex 24, 919–934 (2014).
Artikel PubMed Google Scholar
Kharabian Masouleh, S. et al. Ein höherer Body-Mass-Index bei älteren Erwachsenen ist mit einem geringeren Volumen der grauen Substanz verbunden: Auswirkungen auf die Gedächtnisleistung. Neurobiol. Alter 40, 1–10 (2016).
Artikel PubMed Google Scholar
Willette, AA & Kapogiannis, D. Schrumpft das Gehirn, wenn sich die Taille ausdehnt? Alterungsres. Rev. 20, 86–97 (2015).
Artikel PubMed Google Scholar
Marek, S. et al. Auf dem Weg zu reproduzierbaren hirnweiten Assoziationsstudien. BioRxiv. https://doi.org/10.1101/2020.08.21.257758 (2020).
Yamashita, A. et al. Harmonisierung funktioneller MRT-Daten im Ruhezustand über mehrere Bildgebungsstandorte hinweg durch die Trennung von Standortunterschieden in Stichprobenverzerrung und Messverzerrung. PLoS Biol. 17, e3000042 (2019).
Artikel CAS PubMed PubMed Central Google Scholar
Botvinik-Nezer, R. et al. Variabilität bei der Analyse eines einzelnen Neuroimaging-Datensatzes durch viele Teams. Natur 582, 84–88 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Liu, S., Seidlitz, J., Blumenthal, JD, Clasen, LS & Raznahan, A. Integrative strukturelle, funktionelle und transkriptomische Analysen der geschlechtsspezifischen Gehirnorganisation beim Menschen. Proz. Natl Acad. Wissenschaft. USA 117, 18788–18798 (2020).
Artikel CAS PubMed PubMed Central Google Scholar
Genon, S., Reid, A., Langner, R., Amunts, K. & Eickhoff, SB Wie man die Funktion einer Gehirnregion charakterisiert. Trends Cogn. Wissenschaft. 22, 350–364 (2018).
Artikel PubMed PubMed Central Google Scholar
Gut, CD et al. Eine voxelbasierte morphometrische Studie des Alterns in 465 normalen erwachsenen menschlichen Gehirnen. Neuroimage 14, 21–36 (2001).
Artikel CAS PubMed Google Scholar
Chen, X., Sachdev, PS, Wen, W. & Anstey, KJ Geschlechtsunterschiede in der regionalen grauen Substanz bei gesunden Personen im Alter von 44–48 Jahren: eine voxelbasierte morphometrische Studie. Neuroimage 36, 691–699 (2007).
Artikel PubMed Google Scholar
Hebart, MN & Baker, CI Dekonstruierende multivariate Dekodierung für die Untersuchung der Gehirnfunktion. Neuroimage 180, 4–18 (2018).
Artikel PubMed Google Scholar
Kohoutova, L. et al. Auf dem Weg zu einem einheitlichen Rahmen für die Interpretation von Modellen des maschinellen Lernens in der Neurobildgebung. Nat. Protokoll. 15, 1399–1435 (2020).
Artikel CAS PubMed Google Scholar
Radua, J., Canales-Rodriguez, EJ, Pomarol-Clotet, E. & Salvador, R. Gültigkeit der Modulation und optimale Einstellungen für erweiterte voxelbasierte Morphometrie. Neuroimage 86, 81–90 (2014).
Artikel PubMed Google Scholar
Malone, IB et al. Genaue automatische Schätzung des gesamten intrakraniellen Volumens: eine störende Variable mit weniger störender Wirkung. Neuroimage 104, 366–372 (2015).
Artikel PubMed Google Scholar
Nichols, TE et al. Best Practices bei der Datenanalyse und dem Datenaustausch in der Neurobildgebung mittels MRT. Nat. Neurosci. 20, 299–303 (2017).
Artikel CAS PubMed PubMed Central Google Scholar
Hong, YW, Yoo, Y., Han, J., Wager, TD & Woo, CW Falsch positive Neurobildgebung: Unveröffentlichte Flexibilität beim Testen räumlicher Hypothesen ermöglicht es, alles als replizierten Befund darzustellen. Neuroimage 195, 384–395 (2019).
Artikel PubMed Google Scholar
Milkowski, M., Hensel, WM & Hohol, M. Reproduzierbarkeit oder Reproduzierbarkeit? Über die Replikationskrise in der Computational Neuroscience und die Weitergabe nur relevanter Details. J. Comput. Neurosci. 45, 163–172 (2018).
Artikel PubMed PubMed Central Google Scholar
Brown, EM et al. Test-Retest-Zuverlässigkeit der automatisierten Hippocampus-Teilfeldsegmentierung von FreeSurfer innerhalb und zwischen Scannern. Neuroimage 210, 116563 (2020).
Artikel PubMed Google Scholar
Hedges, EP et al. Zuverlässigkeit struktureller MRT-Messungen: Auswirkungen von Scan-Sitzung, Kopfneigung, Intervall zwischen Scans, Erfassungssequenz, FreeSurfer-Version und Verarbeitungsstrom. Neuroimage 246, 118751 (2022).
Artikel CAS PubMed Google Scholar
Takao, H., Amemiya, S., Abe, O. & Alzheimer's Disease Neuroimaging, I. Zuverlässigkeit von Veränderungen des Gehirnvolumens, bestimmt durch longitudinale Voxel-basierte Morphometrie. J. Magn. Resonanz. Bildgebung 54, 609–616 (2021).
Artikel PubMed Google Scholar
Watanabe, H. et al. Variabilität des Volumens der grauen Substanz bei jungen gesunden Erwachsenen: Einfluss des Geschlechtsunterschieds und des Genotyps des aus dem Gehirn stammenden neurotrophen Faktors. Großhirnrinde https://doi.org/10.1093/cercor/bhab370 (2021).
Li, X. et al. Über die verarbeitungs- und analysebezogene Variation in den Neurowissenschaften hinaus. bioRxiv https://doi.org/10.1101/2021.12.01.470790 (2021).
Liu, C. et al. Serotonin und Stress im frühen Leben interagieren, um die Gehirnarchitektur und ängstliches Vermeidungsverhalten zu formen – ein Ansatz der TPH2-Bildgebungsgenetik. Psychol. Med. 51, 2476–2484 (2020).
Wei, D. et al. Strukturelle und funktionelle Gehirnscans aus dem Querschnittsdatensatz zur Lebensspanne von Erwachsenen der Southwest University. Wissenschaft. Daten 5, 180134 (2018).
Artikel PubMed PubMed Central Google Scholar
Esteban, O. et al. MRIQC: Weiterentwicklung der automatischen Vorhersage der Bildqualität in der MRT von unsichtbaren Stellen. PLoS ONE 12, e0184661 (2017).
Artikel PubMed PubMed Central CAS Google Scholar
Ashburner, J. & Friston, KJ Voxelbasierte Morphometrie – die Methoden. Neuroimage 11, 805–821 (2000).
Artikel CAS PubMed Google Scholar
Gennatas, ED et al. Altersbedingte Effekte und geschlechtsspezifische Unterschiede in der Dichte, dem Volumen, der Masse und der kortikalen Dicke der grauen Substanz von der Kindheit bis zum jungen Erwachsenenalter. J. Neurosci. 37, 5065–5073 (2017).
Artikel CAS PubMed PubMed Central Google Scholar
Smith, SM et al. Fortschritte in der funktionellen und strukturellen MR-Bildanalyse und -implementierung als FSL. Neuroimage 23 (Suppl 1), S208–S219 (2004).
Artikel PubMed Google Scholar
Jenkinson, M., Beckmann, CF, Behrens, TE, Woolrich, MW & Smith, SM Fsl. Neuroimage 62, 782–790 (2012).
Artikel PubMed Google Scholar
Esteban, O. et al. fMRIPrep: eine robuste Vorverarbeitungspipeline für die funktionelle MRT. Nat. Methoden 16, 111–116 (2019).
Artikel CAS PubMed Google Scholar
Gorgolewski, K. et al. Nipype: ein flexibles, leichtes und erweiterbares Neuroimaging-Datenverarbeitungs-Framework in Python. Vorderseite. Neuroinform 5, 13 (2011).
Artikel PubMed PubMed Central Google Scholar
Tustison, NJ et al. N4ITK: verbesserte N3-Bias-Korrektur. IEEE Trans. Med. Bildgebung 29, 1310–1320 (2010).
Artikel PubMed PubMed Central Google Scholar
Avants, BB, Epstein, CL, Grossman, M. & Gee, JC Symmetrische diffeomorphe Bildregistrierung mit Kreuzkorrelation: Bewertung der automatisierten Markierung älterer und neurodegenerativer Gehirne. Med. Bild Anal. 12, 26–41 (2008).
Artikel CAS PubMed Google Scholar
Zhang, Y., Brady, M. & Smith, S. Segmentierung von MR-Bildern des Gehirns durch ein Hidden-Markov-Zufallsfeldmodell und den Erwartungsmaximierungsalgorithmus. IEEE Trans. Med. Bildgebung 20, 45–57 (2001).
Artikel CAS PubMed Google Scholar
Yan, CG, Wang, XD, Zuo, XN & Zang, YF DPABI: Datenverarbeitung und -analyse für die Bildgebung des Gehirns (im Ruhezustand). Neuroinformatik 14, 339–351 (2016).
Artikel PubMed Google Scholar
Noble, S., Scheinost, D. & Constable, RT Ein Jahrzehnt der Test-Retest-Zuverlässigkeit der funktionalen Konnektivität: eine systematische Überprüfung und Metaanalyse. Neuroimage 203, 116157 (2019).
Artikel PubMed Google Scholar
Noble, S. et al. Einflüsse auf die Test-Retest-Zuverlässigkeit der funktionellen Konnektivitäts-MRT und ihre Beziehung zum Verhaltensnutzen. Großhirn. Cortex 27, 5415–5429 (2017).
Artikel PubMed PubMed Central Google Scholar
Cicchetti, DV & Sparrow, SA Entwicklung von Kriterien zur Feststellung der Interrater-Zuverlässigkeit bestimmter Elemente: Anwendungen zur Bewertung des adaptiven Verhaltens. Bin. J. Ment. Mangelhaft. 86, 127–137 (1981).
CAS PubMed Google Scholar
Lakens, D. Berechnung und Berichterstattung von Effektgrößen zur Erleichterung der kumulativen Wissenschaft: eine praktische Einführung für T-Tests und ANOVAs. Vorderseite. Psychol. 4, 863 (2013).
Artikel PubMed PubMed Central Google Scholar
Referenzen herunterladen
Diese Arbeit wurde vom China MOST2030 Brain Project Nr. 2022ZD0208500, dem National Key Research and Development Program of China (Grant No. 2018YFA0701400) und der National Natural Science Foundation of China (NSFC, No 91632117, 31700998, 31530032) unterstützt.
Diese Autoren haben gleichermaßen beigetragen: Xinqi Zhou, Benjamin Becker.
Das Zentrum für psychosomatische Medizin, das Zentrum für psychische Gesundheit der Provinz Sichuan, das Volkskrankenhaus der Provinz Sichuan, das MOE-Schlüssellabor für Neuroinformation, das Schlüssellabor für Hochfeld-Magnetresonanztomographie der Provinz Sichuan, die Universität für elektronische Wissenschaft und Technologie von China, Chengdu, China
Xinqi Zhou, Renjing Wu, Yixu Zeng, Ziyu Qi, Stefania Ferraro, Lei Xu, Xiaoxiao Zheng, Jialin Li, Meina Fu, Shuxia Yao, Keith M. Kendrick und Benjamin Becker
Institut für Gehirn- und Psychologiewissenschaften, Sichuan Normal University, Chengdu, China
Xinqi Zhou & Lei Xu
Abteilung für Neuroradiologie, Stiftung Carlo Besta Neurological Institute, Mailand, Italien
Stephanie Ferraro
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Konzeption der Studie: XZ und BB; Entworfen wurde die Studie: XZ und BB; Führte die Analyse durch: XZ und RW; Interpretierte die Ergebnisse: XZ, YZ, ZQ, SF, LX, XXZ, JL und MF; Verfasser des Manuskripts: XZ; Kritische Überarbeitungen des Manuskripts vorgenommen: SY, KK und BB Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.
Korrespondenz mit Xinqi Zhou oder Benjamin Becker.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Communications Biology dankt Oscar Esteban und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptredakteure: Jeanette Mumford, Karli Montague-Cardoso und Gene Chong.
Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Zhou, X., Wu, R., Zeng, Y. et al. Die Wahl einer Voxel-basierten Morphometrie-Verarbeitungspipeline fördert die Variabilität der Position neuroanatomischer Gehirnmarker. Commun Biol 5, 913 (2022). https://doi.org/10.1038/s42003-022-03880-1
Zitat herunterladen
Eingegangen: 3. Juli 2021
Angenommen: 23. August 2022
Veröffentlicht: 06. September 2022
DOI: https://doi.org/10.1038/s42003-022-03880-1
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.