https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7773605/
Front Physiol. 2020; 11: 583005.
Vinculando o TDAH e a avaliação comportamental por meio da identificação de conexões funcionais baseadas em tarefas de diagnóstico compartilhadas
Dados Associados
Introdução
O transtorno de déficit de atenção e hiperatividade (TDAH) é o transtorno psicológico mais comumente diagnosticado entre crianças em idade escolar e ao longo da vida ( Bell, 2010 ). Além disso, um estudo com crianças de 8 a 16 anos descobriu que 70% das crianças com diagnóstico clínico de TDAH também tinham alguma forma de dificuldade de aprendizagem, destacando os desafios de desenvolvimento cognitivo que costumam acompanhar os transtornos de atenção ( Mayes et al., 2000 ). Uma definição clínica de TDAH é complicada pela visão predominante de que abrange um continuum ( Graham e Madigan, 2016 ) e existe como subtipos múltiplos ( Garon et al., 2006 ). A partir da quarta edição do Manual Diagnóstico e Estatístico de Transtornos Mentais(DSM-IV), o comprometimento funcional tornou-se obrigatório, no entanto, embora o impacto do TDAH tenha sido bem estudado, seus critérios de diagnóstico de fluidos permanecem um desafio em pesquisas e ambientes clínicos ( Fortes et al., 2020 ). Além disso, embora o TDAH seja um transtorno cognitivo diagnosticável em adultos, a estabilidade de desenvolvimento do diagnóstico é bastante pobre ( Todd et al., 2008 ).
O presente estudo aborda esses desafios com uma exploração da rede cerebral e diferenças comportamentais entre um grupo de jovens adultos com diagnóstico de TDAH na infância e um grupo de participantes de controle de mesma idade. Aplicamos uma abordagem de aprendizado de máquina para analisar essas diferenças com os objetivos complementares conjuntos de identificar uma assinatura de conectividade neural clinicamente diagnóstica de TDAH e relacionar a dinâmica de processamento neural subjacente ao desempenho em uma tarefa de diagnóstico comportamental comumente usada. Além disso, embora a conectividade seja mais comumente medida usando correlações lineares entre séries temporais, nosso uso de medidas baseadas em informações mútuas cruzadas de conectividade funcional destaca o papel importante que os índices alternativos de conectividade funcional podem desempenhar na exploração de correlações cérebro-comportamento. Ao identificar conexões funcionais relacionadas à tarefa que são diagnósticas e preditivas do desempenho da tarefa clinicamente relevante, identificamos as vias neurais que podem estar implicadas em diferentes subpopulações de TDAH e fornecemos um meio pelo qual diferentes populações podem ser identificadas comportamentalmente. Juntos, esses resultados informam como várias ferramentas de diagnóstico podem ser integradas para distinguir melhor os subtipos de diagnóstico e avaliar as intervenções potenciais.
A tarefa de jogo de Iowa como um indicador comportamental de TDAH
O Iowa Gambling Task (IGT) é uma avaliação computadorizada que apresenta aos indivíduos decisões de jogo realistas e é usada experimentalmente para investigar a tomada de decisão normal e desordenada e adaptada para uso clínico ( Lin et al., 2019 ), incluindo para diagnóstico clínico de TDAH ( Toplak et al., 2010 ). A tarefa atribui ao participante uma conta monetária imaginária inicial e pede que ele selecione as cartas de um dos quatro baralhos, causando um ganho ou perda dessa conta. Dois dos baralhos são de alta variância e dois são de baixa variância, no que diz respeito a ganhos ou perdas potenciais, introduzindo um elemento de risco ( Bechara et al., 2005 ).
As evidências de diferenças comportamentais relacionadas ao TDAH no IGT entre adultos e crianças são mistas; alguns estudos mostram pior desempenho para participantes com TDAH, e outros não mostram diferença em relação aos controles ( Groen et al., 2013 ). A implicitude da tarefa pode ser um fator importante na acurácia diagnóstica para crianças. O IGT é teoricamente motivado pela Hipótese do Marcador Somático (SMH) ( Damasio, 1996 ), que sustenta que as mudanças fisiológicas no corpo (marcadores somáticos; por exemplo, suor nas mãos) são correlacionadas e interpretadas como estados emocionais. Os marcadores somáticos e suas emoções evocadas estão associados a eventos e resultados de decisões e moldam o comportamento ( Damasio, 1994) A utilidade do IGT na avaliação do TDAH baseia-se na observação de que o processamento anormal da emoção está associado ao comprometimento da tomada de decisão ( Bechara et al., 2005 ). Roshani et al. (2020) descobriram que ambas as diferenças significativas na pontuação IGT e nos tempos de tomada de decisão do IGT discriminam o TDAH dos controles, com participantes adultos com TDAH menos propensos a favorecer decks vantajosos e fazer seleções de baralho mais rápidas. Esse padrão sugere que a tarefa aproveita a tendência dos participantes do TDAH para fazer escolhas mais arriscadas e impulsivas relacionadas ao processamento anormal de emoções no córtex pré-frontal ventromedial (vmPFC) ( Bechara et al., 1994 ).
Dinâmica de processamento neural como um indicador de TDAH
Em contraste com os resultados comportamentais, o TDAH e as populações de controle parecem mostrar diferenças de processamento neural mais confiáveis no IGT. Grupo de teste de análise de modelo linear geral convencional (GLMA) ou diferenças de condição em sinais de imagem de ressonância magnética funcional (fMRI) dependentes do nível de oxigênio no sangue regional (BOLD), que são indicadores de atividade neural. Em controles saudáveis, os estudos do GLMA mostram que a rede de regiões do cérebro que são recrutadas pela tarefa parece mudar dinamicamente à medida que a tarefa avança, e o histórico da tarefa muda as expectativas dos participantes ( Lin et al., 2008) Ao comparar o TDAH com controles saudáveis, os estudos do GLMA tipicamente mostram que os participantes do TDAH subativam significativamente o pré-cuneus esquerdo e direito, o putâmen e o caudado ao escolher baralhos de recompensa mais alta em comparação com os controles ( Norman et al., 2018 ). Essas regiões estão implicadas no sistema de recompensa dopaminérgica, sugerindo que o processamento irregular dentro dessa rede pode ser um fator nos marcadores comportamentais do TDAH. Um estudo GLMA recente de Yang et al. (2019)examinaram as diferenças de grupo durante o IGT no córtex orbitofrontal, uma região que às vezes é agrupada com o vmPFC maior e faz parte da rede de recompensa putativa. Este estudo descobriu que adultos com TDAH exibiram menor ativação do córtex orbitofrontal e pior desempenho no IGT do que controles saudáveis. Assim, embora a literatura comportamental que apóia a utilidade clínica do IGT na detecção de TDAH seja mista, a literatura de neuroimagem sugere que a sensibilidade da tarefa depende do recrutamento de diferentes redes em controles e populações de TDAH.
Circuito Neural Implicado em Transtornos da Atenção
Todas as redes são descritas em termos de nós e as conexões entre eles, mas diferem na composição entre os domínios. À medida que métodos apropriados da teoria dos gráficos foram desenvolvidos, os neurocientistas cognitivos têm empregado cada vez mais a fMRI para realizar explorações in vivo de redes cerebrais. No domínio neurocientífico, os nós em modelos baseados no cérebro de processos cognitivos correspondem às regiões do cérebro, e suas conexões se referem à conectividade funcional, efetiva ou anatômica entre as regiões do cérebro, embora focaremos principalmente na conectividade funcional - definida como uma coerência temporal entre a atividade em duas regiões ( Honey et al., 2009) A literatura que implica um papel para as redes no TDAH pressupõe que a conectividade (de qualquer tipo) entre as regiões do cérebro determina criticamente como o processamento regional e as interações se desdobram no TDAH. Consequentemente, a conectividade entre e dentro de várias redes identificáveis tem sido explorada como um fator potencial no TDAH ( Castellanos e Proal, 2012 ).
Por ser frequentemente caracterizado como um transtorno de autorregulação, as primeiras investigações do TDAH enfocaram um circuito frontal-subcortical disfuncional ( Voeller, 2004 ), que é amplamente considerado como desempenhando um papel crítico na regulação da atenção e impulsividade ( Chow e Cummings , 1999 ; Bonelli e Cummings, 2007 ). Além disso, a ativação em outra sub-rede frontal implicada no processamento de recompensas se correlaciona com a gravidade dos sintomas de TDAH ( Stark et al., 2011 ). Isso sugere que a falta de atividade dentro do sistema de recompensa dopaminérgica também pode desempenhar um papel na sintomatologia do TDAH.
Cada vez mais, o TDAH tem sido visto como um distúrbio da rede de modo padrão (DMN), já que a inibição da rede cerebral padrão está associada a um desempenho inferior em muitas tarefas dependentes de atenção ( Buckner et al., 2008 ). O DMN é uma rede de regiões negativas para a tarefa (ou seja, desativada durante a tarefa), que se acredita compreender subsistemas distintos, mas conectados ( Buckner et al., 2008 ; Andrews-Hanna et al., 2010 ) que se desenvolvem até a idade adulta, tornando-se cada vez mais integrados com idade ( Fair et al., 2008 ). Como o DMN pode ser explorado usando ressonância magnética em estado de repouso, uma vantagem clínica desse paradigma é que ele não exige que os pacientes realizem tarefas cognitivamente exigentes ( Bullmore, 2012), o que pode ser especialmente desafiador para crianças com déficits de atenção. Dito isso, uma revisão de estudos de conectividade funcional como biomarcador de TDAH entre 2008 e 2017 encontrou precisões diagnósticas amplamente variáveis, variando de 0,55 a 0,95 ( Du et al., 2018 ). A maioria dos estudos revisados empregou classificadores de caixa preta que foram aplicados com o objetivo de otimizar a precisão do diagnóstico, em vez de descobrir mecanismos teóricos subjacentes a conexões funcionais específicas.
Embora o DMN seja uma rede negativa para a tarefa, a atividade positiva para a tarefa está associada ao aumento da conectividade funcional, relacionando o córtex pré-frontal dorsolateral ao DMN ( Buckner et al., 2008 ). O esforço de atenção durante as tarefas requer uma mudança do modo padrão do cérebro para um modo ativo, e as análises de fMRI BOLD indicam um padrão de atividade de baixa frequência alternada entre atividades positivas e negativas para a tarefa ( Fransson, 2005 ). A divagação da mente é uma das características prototípicas do TDAH e é considerada negativamente associada à ativação do córtex cingulado anterior ventral (ACC), o pré-cuneiforme e a junção temporoparietal - todas as regiões dentro do DMN ( Mason et al., 2007 ; Christoff et al., 2009) Como a atividade DMN normalmente diminui durante as tarefas, Konrad e Eickhoff (2010) sugerem que a falha em inibir a atividade DMN pode ser uma assinatura neural do TDAH. Os autores, no entanto, observam que a literatura é inconsistente no que diz respeito ao papel causal da conectividade funcional, com diferentes modelos que caracterizam o TDAH como hiperconectividade ( Tian et al., 2006 ) ou, inversamente, como hipoconectividade ( Castellanos e Tannock, 2002 ) de o DMN.
Grande parte do trabalho sobre conectividade funcional concentra-se em MRI de estado de repouso (rs-MRI) e, portanto, na conectividade dentro do DMN negativo para a tarefa. Conforme observado por Castellanos e Aoki (2016) , um dos desafios dos estudos de rs-MRI é que, na ausência de um sinal de tarefa modelo, os artefatos estatísticos relacionados ao movimento da cabeça introduzem uma fonte confusa de variabilidade no sinal que é difícil de desembaraçar de sinais de interesse; o problema é agravado pelo aumento da propensão das populações com TDAH ao movimento excessivo da cabeça. Os autores argumentam que esses obstáculos exigem o desenvolvimento de novos procedimentos analíticos em grandes conjuntos de dados abertos. Além disso, Gonzalez-Castillo e Bandettini (2018)argumentam que existem diferenças importantes entre o estado de repouso e a conectividade funcional baseada em tarefas, e que a reconfiguração que as redes cerebrais sofrem durante as tarefas informam as bases neurais dos processos cognitivos. Este ponto é especialmente relevante para o estudo do TDAH, uma vez que os estudos citados anteriormente mostram que o recrutamento da rede sob o IGT é dinamicamente dependente da progressão da tarefa, sugerindo que a dinâmica da rede ao inibir e exibir comportamentos é importante para entender como aqueles com TDAH realizar a tarefa.
A tarefa go / no-go tem sido amplamente utilizada em estudos de neuroimagem de TDAH, porque se supõe que depende fortemente da interação entre atenção e inibição de resposta ( Simmonds et al., 2008 ; Hwang et al., 2019 ). Tem sido argumentado mais recentemente ( Michelini et al., 2019 ) que a conectividade funcional atípica baseada em tarefas em indivíduos com TDAH na infância pode persistir na idade adulta. Tomados em conjunto, esses achados sugerem que uma assinatura neural de TDAH pode ser encontrada na conectividade funcional baseada em tarefas da tarefa ir / não ir, mesmo de adultos jovens, avançando esta abordagem como um detector potencial de biomarcadores que podem resolver a baixa estabilidade de diagnóstico de TDAH ( Guo et al., 2020 ).
O presente estudo: identificação de uma assinatura persistente de FC baseada em tarefas de TDAH
O presente baseia-se em estudos anteriores de neuroimagem que exploram a conectividade dependente da tarefa da tarefa ir / não ir para investigar a assinatura conectômica persistente do TDAH infantil em adultos jovens. Usamos uma série de modelos de classificador feedforward multicamadas para prever o diagnóstico clínico e o desempenho no IGT e a arquitetura desses modelos permite a classificação de grupos incorporados e, consequentemente, acomoda relacionamentos de outra forma inconsistentes. Por exemplo, a conexão funcional X pode ser um diagnóstico de TDAH se Y e Z também forem fortes, mas não um diagnóstico de outra forma. Mostraremos que a conectividade funcional baseada em tarefas prevê de forma confiável o diagnóstico de TDAH e o desempenho do IGT, e que um pequeno número da maioria das conexões de diagnóstico permitiu uma precisão quase equivalente. Além disso,
Materiais e métodos
Conjunto de dados de arquivamento e participantes
Analisamos MRI de arquivo e dados comportamentais do acompanhamento longitudinal do Estudo de Tratamento Multimodal de TDAH patrocinado pelo NIMH ( MTA 168 ). O MTA foi um estudo multi-local projetado para avaliar as estratégias de tratamento do TDAH e incluiu quase 600 crianças, com idades entre 7 e 9 anos, que foram aleatoriamente designadas para um dos quatro modos de tratamento: medicamentoso, comportamental, combinação de medicamentos e cuidados comportamentais ou de rotina na comunidade. Os pais ouviram sobre o estudo por meio de profissionais de saúde, professores ou anúncios e contataram os pesquisadores que entrevistaram as crianças e os pais para determinar a elegibilidade. Nosso conjunto de dados incluiu os 80 participantes adultos (64 homens) do MTA 168estudo que completou a tarefa de fMRI go / no-go. Destes, 55 receberam um diagnóstico de TDAH durante a infância e o restante eram controles pareados por idade. A idade média do subconjunto de participantes no momento da varredura era 23,97 anos ( DP = 1,29). Os procedimentos do estudo MTA 168 para diagnóstico, tratamento específico e dados demográficos da amostra foram descritos em outro lugar ( MTA Cooperative Group, 1999 ), e usamos os metadados diagnósticos e comportamentais fornecidos com o conjunto de dados para o treinamento do modelo.
Projeto e Procedimento MTA
Os dados arquivísticos da tarefa Go / No-Go fMRI foram gerados a partir do estudo descrito em Rasmussen et al. (2016), e o leitor deve consultar o estudo original para obter mais detalhes. Resumidamente, a tarefa Go / No-Go usou um design relacionado ao evento aleatório e instável e exigiu que os participantes respondessem pressionando o botão quando apresentada a uma imagem alvo, mas retendo a resposta quando apresentada a uma imagem não alvo. As imagens funcionais do eco planar foram adquiridas em 154 volumes usando os seguintes parâmetros de aquisição: TR (tempo de repetição; o período necessário para 1 aquisição de volume completo) = 2.000 ms; TE (tempo de eco; o período entre um pulso de RF e seu gradiente de eco) = 30 ms; 32 fatias axiais; tamanho do voxel = 3,4 × 3,4 × 4,0 mm, Slice Gap = 1 mm. Imagens ponderadas em T1 foram adquiridas usando os seguintes parâmetros: TR = 2170 ms; TE = 5,56 ms; 160 fatias sagitais; tamanho do voxel = 1 × 1 × 1,2 mm. O MTA 168estudo utilizou o procedimento IGT descrito em Bechara et al. (1994) . Para o estudo MTA 168 , a pontuação IGT foi calculada subtraindo as opções de cartas desvantajosas das escolhas de cartas vantajosas.
Processamento de Dados Funcionais
Aplicamos aqui o pipeline de processamento de dados usado em uma aplicação recente de um classificador de aprendizado de máquina multicamadas para conectividade funcional e análise de padrão cortical em escala grosseira ( McNorgan et al., 2020) As imagens funcionais foram co-registradas com a superfície anatômica 3D gerada pelo FreeSurfer (versão 6.0) para cada participante e mapeadas em um modelo estrutural comum para análise de grupo usando voxels isomórficos de 2 mm. Os dados funcionais foram pré-processados usando FS-FAST interoperando com FSL (versão 5.0) para aplicar correção de movimento, correção de tempo de corte e suavização espacial usando um kernel Gaussiano de 4 mm. A filtragem do sinal temporal dos dados funcionais foi aplicada apenas por meio da regressão das tendências lineares, do sinal da substância branca e do LCR e dos parâmetros de movimento, no entanto, a filtragem baseada na frequência não foi aplicada. Os dados funcionais foram mapeados para o espaço de superfície modelo do FreeSurfer para regiões corticais e, em seguida, para o espaço modelo 3D MNI305 para regiões subcorticais.
Análise de modelo linear geral e região funcional de geração de interesse
Uma análise de modelo linear geral (GLMA) foi realizada no espaço de superfície do modelo do FreeSurfer e no espaço 3D MNI305 no nível do participante, usando um projeto relacionado a eventos com os ensaios go e no-go incluídos como condições de interesse ("tarefa") e participante parâmetros de movimento como regressores sem interesse, modelados usando a função de resposta hemodinâmica canônica SPM para gerar um mapa de contraste para todas as atividades da tarefa vs. uma linha de base de repouso implícita. Isso produziu uma máscara funcionalmente definida de regiões corticais e subcorticais com alta relação sinal-ruído, e notamos que incluiu regiões que foram ativadas e desativadas em relação ao repouso. Os contrastes de nível de grupo foram limitados com um nível de significância voxel de p= 0,001 e uma simulação de permutação de Monte Carlo aplicou um nível de significância corrigido para tamanho de cluster de p = 0,05. Esses limites de significância de todo o cérebro são comumente aplicados a contrastes GLMA para identificar regiões que mostram diferenças de grupo ou condição, incluindo estudos anteriores de TDAH usando o IGT e a tarefa ir / não prosseguir (por exemplo, Suskauer et al., 2008 ; Yang et al., 2019 ).
É improvável que grandes manchas corticais sejam organizadas de forma homogênea e, portanto, agrupamentos de nível de grupo significativos foram mapeados para o espaço da superfície, que o utilitário FreeSurfer mris_divide_parcellation subdividiu algoritmicamente em 302 (115 esquerda, 144 direita, 42 subcorticais) regiões de interesse (ROI) comparáveis tamanho para os ROIs da parcela de Lausanne. O algoritmo subdivide os vértices dentro de cada ROI perpendicular ao seu eixo mais longo para que todas as subdivisões tenham aproximadamente o mesmo número de vértices e cubram até uma área de superfície designada (400 mm 2 em nosso estudo). Essa abordagem foi usada em estudos anteriores de conectividade funcional no espaço de superfície ( Hagmann et al., 2008 ; Honey et al., 2009 ; Hagmann et al., 2010 ;McNorgan e Joanisse, 2014 ; McNorgan et al., 2020 ;Figura 1A)
Conectividade funcional e geração de padrões
Seleção de Característica Inicial Baseada em Correlação
Conforme indicado anteriormente, a conectividade funcional corresponde à coerência temporal entre duas regiões do cérebro e é normalmente calculada usando a correlação de Pearson entre as séries de tempo de ativação. Entre n regiões do cérebro, podemos computar n ( n −1) / 2 correlações de pares, e esta relação exponencial complica a análise e interpretação da conectividade funcional: preditores supérfluos entre um grande número de conexões funcionais podem levar a modelos que se ajustam aos dados de treinamento e não generalizam ( Hawkins, 2004 ; Castellanos e Aoki, 2016), e é um desafio resumir e construir uma síntese teórica de milhares de conexões funcionais. Por essas razões, os estudos de neuroimagem geralmente restringem as análises a um subconjunto de ROIs ou, conforme apropriado para um estudo de conectividade, um conjunto de conexões de interesse (COIs). Um método comum de identificar conexões funcionais significativas dentro de uma matriz de adjacência é aplicar um limite de significância estatística (por exemplo, Tomasi e Volkow, 2011 ; Zeng et al., 2014) Como será explicado em breve, as medidas de dependência de informações mútuas cruzadas têm vários recursos que as recomendam para uso na exploração da conectividade funcional. Infelizmente, na ausência de um teste de significância paramétrica para esses valores, eles não se prestam prontamente a limiares baseados em significância. Por esse motivo, usamos correlações lineares convencionais como um filtro de primeira passagem inicial em nossa seleção de recursos.
As séries temporais BOLD médias foram calculadas em todos os voxels em cada ROI (Figura 1B) Correlações pareadas de Pearson entre vetores de séries temporais regionais sem tendência e normalizados (Figura 1C) foram calculados entre todas as ROIs para cada uma das 4 execuções, eliminando o triângulo inferior redundante da matriz de correlação simétrica. Os 5% principais dos valores de correlação em pelo menos 30% de todas as matrizes de correlação foram usados como um filtro de seleção para garantir que as análises incluíssem conexões funcionais entre regiões do cérebro que estavam fortemente correlacionadas em algumas - mas não necessariamente todas - execuções funcionais (Figura 1D) Este critério de seleção não garantiu que as conexões funcionais selecionadas fossem fortes em todos os indivíduos, ou mesmo entre todas as execuções funcionais para um único indivíduo. Isso foi intencional, porque uma seleção incluindo apenas conexões funcionais uniformemente fortes impede diferenças relacionadas ao grupo. Em vez disso, essa abordagem garantiu que os padrões de conectividade funcional variassem uns dos outros, sem introduzir qualquer tendência estatística nos padrões associados a qualquer classificação. Além disso, como cada conexão funcional selecionada era livre para variar entre as execuções dentro de cada participante, essa abordagem evitou que os classificadores dependessem de padrões idiossincráticos associados a indivíduos específicos, promovendo generalizabilidade.
Geração de padrões a partir da conectividade funcional de informações mútuas
Embora tenhamos usado o filtro de seleção para identificar um conjunto inicial de COIs, a força da conexão foi estimada como a informação mútua cruzada (XMI) ( Abarbanel e Gollub, 1996 ) entre vetores de série temporal de ROI porque a informação mútua é mais sensível à dependência geral entre duas variáveis, que podem ou não ser lineares ( Li, 1990 ), são mais robustas para processos não estacionários comumente encontrados em séries temporais neurais ( Wollstadt et al., 2014 ), e podem ser mais sensíveis à sincronização em sistemas ruidosos ( Paluš, 1997 ). Finalmente, os valores de informação mútua são sempre positivos, o que evita que regiões anticorrelacionadas complicem a construção de padrões de entrada.
A estatística média de informações mútuas cruzadas é definida como
Onde P se refere a probabilidades maiores que 0 em uma densidade de probabilidade bidimensional: P (k) representa a probabilidade da primeira variável e P (l) a segunda variável. P (k, l) é a probabilidade conjunta dentro de um determinado bin ou intervalo de valores nos eixos X e Y. Nc é o número de colunas, representando bins ou valores separados nos quais o histograma ou função de densidade foi calculado para a variável X. Nr é o número de linhas, representando as caixas ou valores separados sobre os quais o histograma ou densidade foi calculado para a variável Y. É normalmente normalizado por log ( Total Bins), seu valor máximo para um determinado número de caixas (ou seja, Nc × Nr ). Embora a estatística de informações mútuas seja capaz de capturar uma dependência linear entre as variáveis, ela também captura qualquer dependência geral entre elas. Para este projeto, M foi calculado a partir da saída de uma função de densidade de kernel Gaussiano da Transformada Rápida de Fourier bidimensional. Trabalhos anteriores ( McNorgan e Joanisse, 2014 ) encontraram valores de conectividade funcional normalmente distribuídos e, portanto, o número de compartimentos usados no cálculo de XMI foi determinado pela fórmula de Scott ( Scott, 1979 ):
onde s X é o desvio padrão de X e n é o número de valores.
Os valores XMI foram gravados em um vetor de conectividade (Figura 1E) e marcados com o diagnóstico clínico (TDAH ou Controle) e a pontuação IGT dividida pela mediana (alta ou baixa) para esse participante. Os dados de treinamento do classificador continham, portanto, 80 participantes × 4 execuções = 320 vetores de conectividade marcados. Este conjunto de dados foi aumentado durante o treinamento por meio da aplicação de dropout de recurso ( Shorten e Khoshgoftaar, 2019 ), em que os recursos de entrada de cada padrão de entrada foram definidos como zero com uma probabilidade de 0,4. O abandono, portanto, minimiza simultaneamente a influência de recursos preditivos não confiáveis e introduz distorções aleatórias nos padrões de treinamento, de forma que padrões de entrada exclusivos sejam apresentados em um grande número de eventos de treinamento.
Treinamento de classificador
Classificadores feedforward multicamadas foram treinados usando validação cruzada estratificada k-fold, uma abordagem de validação comumente usada que garantiu a generalização dos resultados do modelo (Figura 2A) A técnica particiona o conjunto de dados em partições de treinamento e teste uma vez para cada k-fold. Dentro de cada dobra, a proporção de exemplos de cada categoria do classificador foi correspondida nas partições de treinamento e teste. Entre dobras, as dobras de teste não se sobrepõem, de modo que todas as amostras aparecem em exatamente um conjunto de validação em todas as dobras. Essa técnica garantiu que a precisão da classificação relatada em toda a simulação reflete a capacidade do modelo de classificar corretamente todos os dados disponíveis, ao mesmo tempo que evita que o modelo seja exposto aos dados do conjunto de validação durante o treinamento. Usamos a validação cruzada quíntupla, com cada dobra gerando um modelo treinado e esse procedimento foi repetido seis vezes para produzir 6 lotes de 5 modelos (30 modelos no total) para gerar estatísticas de distribuição de desempenho do modelo.
Como havia mais TDAH do que participantes de controle, evitamos distorcer as decisões de classificação ao equacionar os tamanhos dos grupos por meio de subamostragem, incluindo os quatro vetores de conectividade para todos os 25 participantes de controle e um número igual (100 no total) de vetores de conectividade selecionados aleatoriamente para os participantes de TDAH , fixando a precisão do classificador de chance em 0,5. Cada lote de modelos usou um subconjunto aleatório diferente dos padrões de TDAH.
Nos modelos multicamadas, existem vários caminhos por meio de camadas ocultas sucessivas entre cada variável preditora e nó de classificação. A influência de uma variável na classificação é, portanto, calculada somando pesos sobre todos os caminhos possíveis através da multiplicação das matrizes de peso (Figura 2C) As unidades classificadoras implicam em uma função de ativação que transforma a entrada somada. Usamos a função de ativação sigmóide logística (Eq. 3):
Esta função dimensiona a entrada para o intervalo de unidade {0,1}, de modo que, conforme a entrada somada se aproxima de ± ∞, o valor de saída se aproxima de 0 ou 1. A compreensão desta propriedade é crítica para interpretar a estrutura de peso da rede, porque fortes pesos negativos estão associados com a classe de saída de 0, e fortes pesos positivos estão associados à classe de saída de 1. Os modelos do classificador podem ser vistos como uma extensão de um classificador de regressão logística binomial convencional para incluir uma série de camadas ocultas, descritas abaixo.
Modelos de classificadores foram implementados no TensorFlow (versão 1.10) 1 . Os valores de entrada são alimentados através de uma sequência de quatro camadas ocultas densamente conectadas, cada uma contendo 12 unidades lineares retificadas (Figura 3) A normalização em lote foi aplicada em cada camada oculta ( Ioffe e Szegedy, 2015 ). Essas ativações alimentaram uma camada classificadora de duas unidades que classificou padrões simultaneamente com relação ao diagnóstico clínico e ao desempenho de IGT. Esta arquitetura de modelo foi informada por aplicativos publicados anteriormente de classificadores feedforward multicamadas para dados de neuroimagem ( Liu et al., 2018 ; McNorgan et al., 2020) O conjunto de treinamento foi balanceado com relação a ambas as classificações e as categorias eram ortogonais (ou seja, saber que uma classificação não era informativa para a outra). Portanto, esses modelos identificam conexões funcionais que são preditivas do desempenho do Diagnóstico e do IGT. Os valores de output com numeração real são atribuídos aos códigos de categoria mais próximos em valor (por exemplo, um output menor que 0,5 foi tratado como uma categorização de “0”).
Modelos Reduzidos
Overfitting é um fenômeno empírico mensurável intimamente relacionado à generalização. O erro de predição ou classificação em um modelo estatístico ou de aprendizado de máquina é quantificável por uma métrica de diferença, como o erro quadrático somado (por exemplo, em modelos de regressão) ou entropia cruzada (por exemplo, em modelos de classificador) ( Kline e Berardi, 2005) Um modelo estatístico ou de aprendizado de máquina é considerado superestimado se a métrica de erro for pequena quando o modelo é aplicado aos dados de treinamento, mas grande quando aplicado a um novo conjunto de dados de validação cruzada. Tal modelo, portanto, não preveria com precisão os resultados de uma amostra aleatória retirada da população, limitando sua utilidade para informar teorias generalizáveis. Não é incomum que os modelos de aprendizado de máquina obtenham um desempenho perfeito para os dados de treinamento e, portanto, é esperada alguma discrepância entre o desempenho do conjunto de treinamento e validação. No entanto, o overfitting é contínuo e mensurável e, portanto, uma abordagem é medir a precisão do conjunto de validação em uma série de replicações usando modelos aleatórios para obter estatísticas de distribuição para a precisão do conjunto de validação.
A etapa de seleção de recursos descrita acima gerou vetores de recursos de entrada contendo 2265 recursos. Para modelos simples, como máquinas de vetor de suporte de duas camadas (SVMs) padrão ou modelos de regressão logística, em que cada recurso de entrada influencia diretamente a classificação, os padrões de entrada de alta dimensão podem levantar preocupações sobre o potencial de super ajuste dos dados de treinamento em dois sentidos relacionados ( Hawkins, 2004): Primeiro, os recursos de entrada supérfluos fornecem oportunidades adicionais para recursos idiossincraticamente preditivos para inflar o desempenho do modelo. Em segundo lugar, os preditores supérfluos levam a modelos não parcimoniosos que pouco fazem para o avanço da teoria. Uma vantagem de nossa arquitetura de modelo de multicamadas é que as camadas ocultas apresentam um gargalo na transmissão do padrão de entrada para as unidades classificadoras. Além da etapa de seleção de recursos antes da geração do padrão de treinamento, este recurso arquitetônico implementa uma etapa de redução de recursos exigindo que a rede crie uma recodificação de análise de componentes independentes não lineares (ICA) 12-dimensional do padrão de entrada ( DeMers e Cottrell 1993 ; Lotlikar e Kothari, 2000 ; Hyvärinen e Bingham, 2003) Ao implementar a etapa de redução de recursos dentro da arquitetura do modelo, em vez de como uma etapa de pré-processamento, as contribuições de recursos individuais do conjunto de dados intacto podem ser avaliadas. Além disso, como o ICA é treinado pelos mesmos sinais de erro que orientam os limites de classificação, os componentes descobertos devem ser otimizados com relação à decisão de classificação. Embora as técnicas de regularização durante o treinamento e a redução da ICA melhorem a generalização para novos dados, continua sendo um desafio discutir de forma significativa mais do que um punhado de conexões funcionais individuais. Assim, reduzimos ainda mais o conjunto de recursos, apelando para a lógica da regressão passo a passo para trás.
O procedimento de seleção de recursos vaza informações sobre os recursos mais informativos entre os modelos que usam o conjunto completo de recursos e aqueles que usam um conjunto de recursos reduzido, no entanto, isso não é problemático por dois motivos: Primeiro, a seleção de recursos foi destinada a facilitar a interpretação, em vez de melhorar precisão; a sobrevivência e subsequente inclusão de preditor x i na geração modelo reduzida é análoga à sobrevivência de preditor x i na n + passo 1Te num trás de regressão múltipla. Em segundo lugar, cada um dos 6 lotes do modelo são independentes, impedindo o vazamento de informações entrelotes. As análises que seguem agregam resultados em todos os lotes do modelo, permitindo medidas de confiabilidade preditiva para cada conexão funcional e, mais importante, a avaliação de um modelo que compreende os recursos mais informativos identificados independentemente por cada lote de modelos.
Avaliamos primeiro o desempenho de 30 modelos treinados nos vetores de entrada completos (Figura 2B) Em seguida, depois de normalizar os pesos de caminho somados (Figura 2D), identificamos as conexões funcionais com pesos de caminho para a unidade de classificação de TDAH nas caudas de ± 0,025 da distribuição de pesos em todos os modelos (Figura 2E) Essa seleção reduziu ainda mais nossos padrões de entrada para incluir apenas os valores de conectividade funcional XMI que mais diagnosticavam a classificação de TDAH em todos os modelos aleatórios. Finalmente, repetimos o procedimento de validação cruzada quíntupla acima, treinando no espaço de entrada reduzido para gerar seis lotes quíntuplos (30 modelos no total) de Modelos de Características Reduzidas (Figura 2F) Relatamos o desempenho de classificação dos Modelos Reduzidos abaixo.
Avaliação de modelo
A precisão do conjunto de validação foi usada para avaliar a eficácia da conectividade funcional nas decisões de classificação nas quais os modelos foram treinados. As influências relativas de conexões funcionais individuais nas decisões de classificação foram avaliadas pelo cálculo dos pesos de caminho somados de cada unidade de entrada (cada uma codificando a conectividade funcional entre um par de regiões do cérebro) para cada uma das unidades classificadoras. Além de avaliações paramétricas de conexões funcionais preditivas sob uma distribuição normal, uma avaliação não paramétrica foi realizada comparando o desempenho de classificação para redes com pesos de unidades influentes removidos seletivamente contra o desempenho de redes com um número equivalente de pesos selecionados aleatoriamente removidos.
Resultados
Relatamos várias medidas de desempenho do modelo, calculadas em todas as cinco vezes para cada um dos 6 lotes ( n = 30) de modelos. Essas medidas incluem precisão média de classificação ( M ), taxa de acerto, taxas de falso alarme e d-prime registrado para diagnóstico clínico e classificações IGT. Como o TDAH foi mapeado para zero, um verdadeiro positivo era uma classificação correta de Controle para a categoria 1, e um verdadeiro negativo era uma classificação correta de TDAH para a categoria 0. As medidas da teoria de detecção de sinais de desempenho do modelo foram definidas pelas fórmulas 4, 5, e 6 para taxa de acerto (HIT), taxa de falso alarme (FAR) e d-prime (d ′):
Onde Z ( X ) representa a pontuação Z correspondente aos cauda direita p -Valores associados a proporção X . Os testes t de cauda direita de amostra única contra o acaso (0,5) foram corrigidos por Bonferroni-Holm para comparações múltiplas, que foi escolhido por ser a correção mais conservadora. Os modelos de conjunto de recursos completos e reduzidos demonstraram desempenho de classificação muito alto em diagnósticos clínicos e classificações de desempenho IGT, vinculando explicitamente o desempenho IGT ao TDAH por meio de uma impressão digital conectômica compartilhada.
Como os pesos do modelo são compartilhados entre as categorias de saída, o treinamento do classificador para ambas as categorias restringe o espaço de solução para o conjunto de conexões funcionais que são diagnósticas ideal para ambos os tipos de classificação ( McNorgan et al., 2020 ). Ambas as classificações tiveram precisão bem acima do acaso ( M Clínica = 0,91, SD = 0,07, t (29) = 32,78, p <0,00001; M IGT = 0,91, SD = 0,06, t (29) = 34,10, p<0,00001). Os escores HIT, FAR e d-prime indicam que os modelos alcançaram alta precisão por meio de alta sensibilidade e alta especificidade ( HIT Clínico = 0,86, FAR Clínico = 0,04, d ′ Clínico = 2,90; HIT IGT = 0,83, FAR IGT = 0,02, d ′ IGT= 3,03). Por fim, observamos que esses valores representam o desempenho por corrida (ou seja, para conectividade obtida em apenas uma das quatro execuções). Assim, se a classificação usou a classificação modal de todas as quatro matrizes de conectividade, a precisão do nível do participante aumenta para 0,991, ou 99%. A alta precisão sugere uma consistência relativamente robusta nas conexões funcionais que distinguem os dois grupos.
Podemos comparar nossa arquitetura de classificador feedforward multicamadas com o desempenho de classificação para um classificador SVM linear mais convencional, para apreciar o benefício do ICA incorporado habilitado pelas transformações de camada oculta no padrão de entrada. Com apenas um único hiperplano de classificação, séries de classificadores SVM em subconjuntos aleatórios balanceados dos dados de treinamento demonstraram pior precisão de classificação do conjunto de validação para diagnóstico clínico ( M Clínico = 0,58, DP = 0,05) e desempenho IGT ( M IGT = 0,86, SD = 0,07). O desempenho da classificação é atribuível à baixa sensibilidade para o diagnóstico clínico ( HIT Clinical = 0,16, FARClínico= 0,00). Esclareceremos que o FAR é relatado no contexto de um “acerto” mapeado para a categoria Controle: embora as classes fossem balanceadas, os modelos SVM classificaram 93% de todos os padrões como TDAH, mostrando decisões de classificação claramente enviesadas em todas as simulações aleatórias. O SVM FAR é, portanto, indicativo de uma relutância em atribuir qualquer padrão ao diagnóstico de controle, ao invés de uma especificidade muito alta. Essa diferença reforça a importância da redução de recursos para mitigar o sobreajuste e das relações não lineares nas decisões de classificação - principalmente para o diagnóstico clínico. Observamos também que o classificador SVM linear não pode tomar decisões de classificação simultâneas de duas categorias ortogonais. Esses classificadores foram treinados para fazer classificações clínicas e IGT de forma independente,
Conectividade Funcional de Diagnóstico
A classificação de TDAH foi mapeada para um valor de produção clínica de zero e, portanto, pesos negativos fortes para a unidade de classificação clínica foram preditivos de um diagnóstico de TDAH (por implicação, conectividade positiva fraca foi, portanto, preditiva de um diagnóstico de TDAH). O baixo desempenho do IGT foi mapeado para um valor de saída IGT igual a zero. Para facilitar a interpretação, normalizamos os pesos de caminho somados entre cada conexão funcional e saída de classificação. Conexões funcionais que são preditivas de classificação Clínica e IGT teriam pesos de valor absoluto altos para ambas as saídas. Assim, identificamos conexões funcionais com um valor absoluto de qualquer peso normalizado maior que | Z | = 1,65 (percentil 95), e destacar aqueles para os quais o produto dos pesos foi maior que 1,65 2, indicando pesos nas caudas extremas para ambas as classificações. Essas conexões funcionais altamente preditivas , para as quais a forte conectividade é mais diagnóstica de um diagnóstico de TDAH, são relatadas emtabela 1, e aqueles para os quais a conectividade forte prevê um diagnóstico de controle - e, portanto, a conectividade fraca é um diagnóstico de um diagnóstico de TDAH - são relatados em mesa 2. Nessas tabelas, relatamos os pesos do caminho do modelo médio normalizado entre cada conexão funcional preditiva e as unidades de classificação para as classificações Clínica e IGT. Esses pesos são classificados pelo produto de seus valores absolutos. Conexões funcionais altamente preditivas são indicadas com um asterisco.
TABELA 1
Aula IGT | Clínico | IGT | Rótulo | X | Y | Z | Rótulo | X | Y | Z | produtos |
IGT alto | –5,32 | 1,57 | Occipital Mid. eu | –39 | –74 | 32 | Occipital Mid. eu | –39 | –70 | 38 | -8,33 * |
-2,61 | 2,66 | Temporal. Mid R | 48 | –55 | 17 | Temporal Mid. R | 49 | –56 | 11 | -6,94 * | |
-1,98 | 2,85 | Cingulum Post. eu | –6 | –30 | 29 | Cingulum Mid. eu | –6 | –27 | 30 | -5,64 * | |
-2,63 | 1,47 | Rolandic Oper. R | 54 | –18 | 19 | Insula R | 34 | –16 | 16 | -3,88 * | |
-1,82 | 1,54 | Precentral R | 31 | –25 | 56 | R pós-central | 27 | –42 | 59 | -2,80 * | |
-1,04 | 2,57 | Fusiform R | 29 | –83 | -3 | Calcarine R | 22 | –86 | 1 | -2,67 | |
-1,73 | 1,45 | Occipital Mid. eu | –17 | –93 | 6 | Occipital Mid. eu | –24 | –87 | 6 | -2,50 | |
-2,50 | 0,94 | Sup. Temporal R | 51 | –35 | 15 | Sup. Temporal R | 40 | –27 | 10 | -2,35 | |
-2,40 | 0,98 | Temporal Mid. R | 54 | –42 | -1 | Temporal Mid. R | 49 | –56 | 11 | -2,34 | |
–0,51 | 4,28 | Calcarine L | –7 | –85 | 13 | Calcarine R | 9 | –72 | 14 | -2,20 | |
-2,22 | 0,97 | Insula L | –41 | 15 | 7 | Insula L | –35 | 18 | 0 | -2,15 | |
-2,69 | 0,76 | Angular R | 36 | –55 | 42 | SupraMarginal R | 49 | –40 | 41 | -2,06 | |
–0,94 | 2,16 | Calcarine L | –7 | –85 | 13 | Calcarine L | –8 | –79 | 12 | -2,03 | |
–5,02 | 0,37 | Occipital Mid. R | 29 | –65 | 26 | Temporal Mid. R | 49 | –56 | 11 | -1,83 | |
–0,57 | 2,97 | Sup. Temporal R | 51 | –35 | 15 | SupraMarginal R | 43 | –28 | 34 | -1,69 | |
–0,49 | 3,27 | Putamen R | 36 | 6 | 0 | Insula R | 35 | 15 | -3 | -1,61 | |
–0,48 | 2,85 | Calcarine R | 9 | –83 | 13 | Fusiform R | 30 | –69 | -2 | -1,38 | |
-2,84 | 0,30 | Inf. Temporal R | 47 | –51 | –14 | Occipital Inf. R | 39 | –66 | –14 | –0,85 | |
-3,77 | 0,15 | SupraMarginal R | 58 | –41 | 30 | Angular R | 53 | –49 | 32 | –0,56 | |
–0,16 | 3,24 | R pós-central | 55 | –10 | 33 | Precentral R | 42 | –10 | 45 | –0,53 | |
IGT baixo | -3,73 | -2,27 | Fusiform L | –36 | –66 | –10 | Occipital Inf. R | 44 | –75 | –11 | 8,49 * |
-2,72 | -1,39 | Fusiform L | –42 | –58 | –13 | Occipital Inf. eu | –30 | –82 | –8 | 3,78 * | |
-3,51 | -1,03 | R lingual | 16 | –53 | -3 | R lingual | 18 | –43 | –5 | 3,62 * | |
-3,17 | -1,00 | Occipital Sup. eu | –10 | –97 | 7 | Calcarine L | –19 | –78 | 6 | 3,17 * | |
-2,23 | -1,37 | Lóbulo Paracentral L | –14 | –34 | 66 | L pós-central | –24 | –36 | 57 | 3,06 * | |
-2,31 | -1,12 | Caudate L | –13 | 19 | 8 | Caudate R | 13 | 19 | 8 | 2,60 | |
-2,81 | –0,92 | Fusiform L | –33 | –73 | –15 | L lingual | –11 | –77 | –5 | 2,58 | |
-1,09 | -2,15 | Precuneus R | 11 | –49 | 56 | R pós-central | 13 | –36 | 64 | 2,35 | |
-2,23 | -1,05 | L lingual | –14 | –54 | -4 | R lingual | 16 | –53 | -3 | 2,33 | |
–0,81 | -2,34 | Calcarine L | –8 | –79 | 12 | Calcarine R | 9 | –83 | 13 | 1,89 | |
–0,34 | -2,76 | Lóbulo Paracentral L | –14 | –26 | 66 | Insula L | –28 | 28 | 3 | 0,94 | |
–0,28 | -2,92 | Fusiform R | 30 | –69 | -2 | Calcarine R | 25 | –55 | 11 | 0,82 | |
–0,23 | -3,44 | L lingual | –11 | –77 | –5 | R lingual | 17 | –62 | –6 | 0,79 | |
–0,22 | -2,97 | Occipital Mid. eu | –24 | –87 | 6 | L lingual | –22 | –76 | –8 | 0,66 |
MESA 2
Classe IGT | Clínico | IGT | Rótulo | X | Y | Z | Rótulo | X | Y | Z | produtos |
IGT alto | 4,28 | 2,77 | Cingulum Ant. eu | –12 | 44 | 2 | Frontal Med. Orb R | 11 | 51 | -3 | 11,82 * |
2,96 | 2,67 | Fusiform L | –33 | –73 | –15 | Occipital Inf. eu | –16 | –92 | –9 | 7,90 * | |
3,29 | 2,35 | Occipital Inf. R | 39 | –66 | –14 | Fusiform R | 38 | –53 | –18 | 7,73 * | |
2,54 | 1,95 | Calcarine L | –7 | –85 | 13 | R lingual | 8 | –69 | 2 | 4,94 * | |
1,53 | 3,10 | Precentral R | 26 | –25 | 52 | Rolandic Oper. R | 39 | –30 | 20 | 4,75 * | |
3,92 | 1,19 | Occipital Inf. eu | –16 | –92 | –9 | R lingual | 26 | –84 | –9 | 4,66 * | |
1,50 | 3,06 | L pós-central | –26 | –34 | 64 | L pós-central | –24 | –36 | 57 | 4,60 * | |
1,96 | 2.06 | Inf. Temporal R | 47 | –51 | –14 | Fusiform R | 38 | –53 | –18 | 4,03 * | |
2,50 | 1,48 | L pós-central | –43 | –17 | 36 | L pós-central | –59 | –12 | 30 | 3,71 * | |
1,61 | 2,29 | Calcarine L | –17 | –73 | 6 | Calcarine R | 21 | –67 | 9 | 3,69 * | |
2,31 | 1,50 | Angular L | –36 | –58 | 40 | Angular R | 41 | –59 | 29 | 3,47 * | |
2,32 | 1,31 | Insula R | 34 | 17 | 10 | Insula R | 35 | 15 | -3 | 3,03 * | |
1,19 | 2,42 | Fusiform L | –26 | –76 | –6 | R lingual | 10 | –91 | –7 | 2,88 * | |
1,60 | 1,77 | Precentral L | –38 | –8 | 50 | Precentral L | –40 | -2 | 46 | 2,83 * | |
4,12 | 0,67 | Frontal Inf. Oper. R | 49 | 13 | 15 | Frontal Inf. Oper. R | 52 | 13 | 9 | 2,76 * | |
2,40 | 1,14 | Occipital Sup. eu | –20 | –80 | 38 | Parietal Sup. eu | –17 | –70 | 44 | 2,75 * | |
1,29 | 2,11 | Frontal Sup. Medial L | –19 | 39 | 17 | Frontal Med. Orb R | 11 | 51 | -3 | 2,74 * | |
1,64 | 1,61 | L lingual | –21 | –67 | 4 | Calcarine R | 9 | –72 | 14 | 2,65 | |
1,70 | 1,51 | Calcarine R | 9 | –72 | 14 | R lingual | 8 | –69 | 2 | 2,58 | |
2.05 | 1,15 | Cuneus L | –7 | –63 | 24 | Precuneus L | –11 | –57 | 13 | 2,37 | |
2,14 | 1.09 | Cingulum Mid. eu | –10 | 15 | 44 | Supp Motor Area L | –11 | 7 | 49 | 2,34 | |
2,77 | 0,79 | Cingulum Ant. eu | –12 | 44 | 2 | Frontal Sup. Medial L | –19 | 39 | 17 | 2,19 | |
0,59 | 3,11 | Calcarine L | –7 | –85 | 13 | Calcarine R | 15 | –71 | 6 | 1,83 | |
0,59 | 2,79 | Precuneus L | –12 | –47 | 60 | Lóbulo Paracentral R | 14 | –41 | 53 | 1,65 | |
2,59 | 0,57 | R pós-central | 38 | –21 | 47 | R pós-central | 38 | –17 | 37 | 1,49 | |
3,01 | 0,24 | Sup. Temporal eu | –47 | –28 | 4 | Sup. Temporal eu | –50 | –18 | 3 | 0,71 | |
0,05 | 3,65 | Amygdala L | –32 | -1 | –16 | Amygdala R | 32 | -1 | –16 | 0,17 | |
3,35 | 0,03 | Temporal Mid. R | 56 | –46 | 1 | Temporal Mid. R | 56 | –34 | –8 | 0,10 | |
IGT baixo | 3,86 | -1,45 | Frontal Inf. Oper. R | 43 | 10 | 20 | Frontal Inf. Oper. R | 46 | 17 | 19 | -5,61 * |
1,81 | -2,85 | Cingulum Post. eu | –14 | –93 | –16 | Cingulum Post. R | 14 | –93 | –16 | -5,16 * | |
3,52 | -1,28 | Frontal Med. Orb R | 11 | 51 | -3 | Frontal Med. Orb R | 10 | 49 | -3 | -4,49 * | |
2.03 | -1,66 | L lingual | –18 | –82 | –8 | R lingual | 17 | –62 | –6 | -3,36 * | |
1,67 | -1,72 | Occipital Mid. R | 29 | –65 | 26 | Caudate R | 13 | 19 | 2 | -2,88 * | |
1,39 | -2,03 | Rolandic Oper. R | 39 | –30 | 20 | Rolandic Oper. R | 45 | –13 | 18 | -2,82 * | |
1,63 | -1,71 | Não-Tarefa | 0 | 0 | 0 | L Cingulado Posterior | –14 | –93 | –16 | -2,78 * | |
2.03 | -1,19 | Calcarine R | 9 | –83 | 13 | R lingual | 8 | –69 | 2 | -2,41 | |
2,10 | -1,03 | Precuneus R | 11 | –49 | 56 | Precentral R | 26 | –25 | 52 | -2,16 | |
3,47 | –0,61 | Angular R | 30 | –60 | 44 | Occipital Sup. R | 31 | –64 | 42 | -2,13 | |
0,60 | -3,41 | Occipital Inf. R | 44 | –75 | –11 | Occipital Inf. R | 36 | –68 | –9 | -2,06 | |
0,20 | -3,22 | Fusiform L | –36 | –66 | –10 | Calcarine L | –7 | –85 | 13 | –0,66 | |
3,31 | –0,18 | Occipital Inf. R | 39 | –66 | –14 | Occipital Inf. R | 33 | –78 | –6 | –0,59 | |
0,16 | -3,57 | R lingual | 26 | –84 | –9 | Fusiform R | 29 | –83 | -3 | –0,55 | |
0,02 | -3,63 | Temporal Mid. R | 48 | –55 | 4 | Fusiform R | 29 | –83 | -3 | –0,07 | |
0,01 | -3,21 | Não-Tarefa | 0 | 0 | 0 | Amygdala R | 32 | -1 | –16 | –0,04 |
Embora nossas conexões altamente preditivas tenham sido identificadas usando limites paramétricos convencionais para determinar a significância, as suposições subjacentes às análises paramétricas convencionais podem não ser justificadas para análises paramétricas diretas de pesos de modelo ( Luengo et al., 2009) Consequentemente, isso não significa necessariamente que as conexões altamente preditivas são significativamente melhores para a previsão do que outras conexões funcionais dentro da rede definida por tarefa. Um teste de permutação contrastou a precisão preditiva para uma série de redes aleatórias treinadas usando apenas o subconjunto de conexões altamente preditivas como entradas e um número igual de redes treinadas usando um número igual de conexões funcionais selecionadas aleatoriamente. A precisão média da classificação do conjunto de teste foi calculada para 10 vezes de 10 conjuntos de modelos (altamente preditivos e de características aleatórias) treinados usando validação cruzada estratificada. Os testes t de amostras independentes descobriram que as conexões funcionais altamente preditivas previram o diagnóstico clínico com maior precisão ( M = 0,76, DP= 0,01) do que as redes de recursos aleatórios ( M = 0,70, SD = 0,02), t (18) = 8,10, p <10 –6 . As conexões funcionais altamente preditivas também previram o desempenho do IGT com maior precisão ( M = 0,72, SD = 0,02) do que as redes de recursos aleatórios ( M = 0,69, SD = 0,01), t (18) = 4,13, p = 0,0003. Assim, as conexões funcionais altamente preditivas foram preditores significativamente melhores para ambas as classificações do que um conjunto comparável de conexões funcionais selecionadas aleatoriamente do conjunto de recursos reduzido.
Se interpretarmos as conexões funcionais listadas em mesa 2 como aqueles para os quais os valores de conectividade baixos são preditivos de um diagnóstico de TDAH, podemos, em vez disso, agrupar esses pesos com relação ao desempenho do IGT e comparar os perfis de conectividade funcional em termos de hiper e hipoconectividade que prevêem um diagnóstico de TDAH. Figura 4Atraça as conexões funcionais que prevêem o diagnóstico e uma pontuação IGT alta: a hipoconectividade do TDAH aparece em azul e a hiperconectividade do TDAH aparece em vermelho. As descrições de rede são derivadas de Yeo et al. (2011)Parcelamento de 7 redes. Para aqueles com alto desempenho de IGT, os modelos prevêem um diagnóstico de TDAH a partir da hipoconectividade inter-hemisférica entre a rede de atenção visual e ventral envolvendo o córtex occipital inferior e fusiforme nas regiões posteriores; hipoconectividade inter-hemisférica dentro do DMN anterior, envolvendo o córtex orbitofrontal medial; e hipoconectividade entre a rede motora direita e a rede de atenção ventral envolvendo os giros supramarginal e pré-central direitos. Além disso, a hiperconectividade dentro da rede de atenção ventral esquerda prediz TDAH concorrente com alto desempenho de IGT.Figura 4Bilustra um perfil de conectividade diferente associado ao baixo desempenho IGT concomitante a um diagnóstico de TDAH. Esta classificação foi associada com hiperconectividade entre a rede visual e rede de atenção ventral, envolvendo córtex occipital inferior fusiforme esquerdo e bilateral, e hipoconectividade dentro do DMN posterior entre giro lingual e giro cingulado posterior, e entre giro lingual para regiões fora da rede definida pela tarefa .
Discussão
Este estudo fez várias novas contribuições para a compreensão do TDAH. Primeiro, aplicamos classificadores de aprendizado de máquina à conectividade funcional relacionada à tarefa da tarefa ir / não ir. A alta precisão alcançada por esses modelos sugere ainda mais medidas baseadas em XMI como métricas úteis de conectividade funcional. Em segundo lugar, nosso foi o primeiro estudo a fazer classificações ortogonais múltiplas de ativações neurais de todo o cérebro, permitindo-nos estabelecer a relevância mútua da conectividade funcional para o desempenho de IGT e o diagnóstico de TDAH. Como as classificações foram baseadas em parâmetros de modelos compartilhados, nossos resultados mostram não apenas que o desempenho do IGT é relevante para o diagnóstico de TDAH, mas, ao identificar as conexões informativas compartilhadas, também mostram por quêesta tarefa é relevante em termos comportamentais. Finalmente, onde o desempenho do IGT é uma das várias ferramentas de diagnóstico, ele pode discriminar entre os subtipos de TDAH e informar o tratamento.
Decisões Paramétricas
Nossa arquitetura de modelo e parâmetros de treinamento foram informados por trabalho anterior ( Liu et al., 2018 ; McNorgan et al., 2020 ) e por ajuste iterativo de hiperparâmetros do modelo. A validação cruzada protege explicitamente contra a preocupação principal com o ajuste paramétrico de modelos matemáticos; ou seja, a otimização do modelo vem à custa de validade externa e generalização para novos dados. Nossa abordagem de modelagem não é específica para nosso conjunto de dados e pode ser aplicada a outras medidas ou domínios. Tais aplicativos podem considerar nossas escolhas paramétricas um ponto de partida útil e ferramentas automatizadas para otimização de espaço paramétrico, como GPflowOpt ( Knudde et al., 2017), que exploram algoritmicamente o espaço hiperparamétrico, podem facilitar o desenvolvimento de modelos otimizados sem sacrificar a generalização.
Embora tenhamos usado medidas convencionais de conectividade baseadas em correlação durante a seleção de recursos, optamos por usar medidas baseadas em XMI em nossos padrões de treinamento precisamente porque essa medida é raramente usada em estudos de conectividade funcional (e, portanto, requer exploração), mas também provavelmente será sensível a os tipos de relações não lineares que antecipamos em um problema de categorização construído em torno de classes separáveis não linearmente entre séries temporais que podem ser não estacionárias ( Wollstadt et al., 2014 ). Nossos resultados não devem ser interpretados como implicando que as medidas baseadas em XMI são necessariamente superiores a outras medidas univariadas ou multivariadas, por exemplo, conforme descrito em Nieto-Castanon (2020). Uma exposição dos méritos relativos de medidas alternativas de conectividade funcional está além do escopo deste estudo e exigiria conhecimento de verdade da conectividade em nossos dados, mas nossos resultados sugerem que XMI pode valer a pena considerar na análise de conectividade funcional.
Relação com o Trabalho Anterior
Alinhar nossos resultados com uma literatura que se concentrou amplamente em rs-fMRI usando abordagens baseadas em sementes é um desafio agravado por nossa identificação de conectividade preditiva usando uma função de distribuição de probabilidade conjunta sobre diagnóstico clínico e desempenho de IGT. No entanto, várias conexões funcionais da literatura do estado de repouso também foram preditivas em nossos dados de tarefa. O alto desempenho do IGT concorrente com o TDAH foi previsto pela hipoconectividade entre o cíngulo anterior e o córtex orbitofrontal, regiões implicadas na motivação de recompensa e atribuição de saliência, respectivamente. A hiperconectividade entre essas regiões foi encontrada por Tomasi e Volkow (2012)usando rs-fMRI. Essa aparente contradição pode ser reconciliada pelo fato de que a rs-fMRI é negativa para a tarefa, sugerindo que a incapacidade de engajar e desligar adequadamente esses dois sistemas é uma característica definidora de alguns indivíduos com TDAH. A hipoconectividade preditiva entre a rede de atenção visual e ventral que observamos também foi encontrada usando rs-fMRI ( Ergül et al., 2019 ) em adultos com transtorno de ansiedade social com TDAH comórbido, mas não em outros.
Poucos estudos combinaram fMRI e aprendizado de máquina para a exploração do TDAH. A classificação SVM da conectividade DMN entre crianças, adultos com TDAH e controles de mesma idade descobriu que o TDAH está associado ao atraso na maturação desse circuito cerebral ( Sato et al., 2012 ). A competição global ADHD-200 viu vários grupos ( Cheng et al., 2012 ; Colby et al., 2012 ; Dey et al., 2012 ) aplicarem classificadores lineares SVM a medidas de conectividade funcional derivadas de um conjunto de dados rs-fMRI multi-site 2 para identificar perfis de conectividade rs-fMRI de TDAH característicos. Cheng e colegas ( Cheng et al., 2012) foram capazes de classificar os participantes com TDAH com 76% de precisão, encontrando conexões frontais e parietais alteradas foram os mais diagnósticos. Colby e colegas ( Colby et al., 2012 ) classificaram os participantes com TDAH com 55% de acerto usando apenas métricas teóricas de gráficos, impedindo a identificação de conexões diagnósticas. Dey et al. (2012)alcançou aproximadamente 70% de precisão de classificação usando métricas teóricas de gráficos preditivos, descobrindo que a seleção de voxel usando uma máscara funcional, conforme aplicada no presente estudo, melhorou muito a precisão de classificação ao eliminar fontes potenciais de ruído. A diferença no desempenho da classificação entre nosso estudo e esses estudos anteriores sugere que, embora as métricas resumidas que quantificam os motivos de conectividade em redes funcionais centrais sejam preditivas de TDAH, as informações sobre conexões específicas fornecem uma grande quantidade de informações diagnósticas adicionais. Guo et al. (2020)demonstraram que os classificadores SVM foram capazes de identificar adultos do sexo masculino com TDAH a partir da conectividade rs-fMRI medida entre crianças com TDAH com 76% de precisão, depois de selecionar os 2% principais de recursos diagnósticos de modelos alternativos - semelhante à etapa de redução de recursos empregada no presente estudo . Os autores argumentam que, embora as características preditivas possam variar um pouco entre a coorte, o desempenho razoável da coorte cruzada sugere que a conectividade funcional em estado de repouso pode ser um biomarcador de TDAH estável no desenvolvimento. Embora nenhuma classificação de coorte cruzada tenha sido realizada no presente estudo, a discriminação precisa do diagnóstico de TDAH na infância a partir da conectividade funcional dependente da tarefa em adultos jovens oferece mais suporte à conectividade funcional como um biomarcador estável no desenvolvimento para o TDAH.
Nosso desenho de estudo é mais semelhante aos estudos recentes de Wang et al. (2018) e Jung et al. (2019) que aplicou classificadores de aprendizado de máquina à conectividade funcional rs-fMRI de todo o cérebro. Esses estudos alcançaram acurácia de classificação de TDAH de 75 e 84%, respectivamente, e ambos identificaram hipoconectividade visual bilateral para DMN associada ao TDAH. O presente estudo também descobriu que a hipoconectividade da rede visual direita para uma região dentro do DMN anterior foi fortemente preditiva de TDAH, mas apenas para aqueles que se saíram relativamente mal no IGT; para aqueles que se saíram bem no IGT, hipoconectividade inter-hemisférica dentroa rede visual foi preditiva de TDAH, ao contrário do padrão relatado por Wang e colegas. Isso é facilmente reconciliado observando-se que o TDAH está normalmente associado a um baixo desempenho do IGT e, portanto, que as classificações paralelas permitiram que nosso modelo particionasse categoricamente perfis de TDAH típicos e atípicos. Wang e colegas e Jung e colegas identificaram adicionalmente a hiperconectividade entre várias regiões em várias redes funcionais, enquanto a hiperconectividade raramente era altamente preditiva em nossos dados de conectividade baseados em fMRI, encontrados principalmente dentro da rede visual para indivíduos que mostram o perfil de desempenho IGT pobre característico. Combinado com nossos resultados, esse padrão sugere que a hiperconectividade em estado de repouso, mas a hipoconectividade relacionada à tarefa, pode ser característica do TDAH, indicando uma dificuldade geral no engajamento apropriado para a tarefa e no desligamento de múltiplas redes funcionais, mas que os indivíduos com TDAH que apresentam desempenho atípico no IGT demonstram um perfil de conectividade diferente dentro da rede de processamento visual. Se esses indivíduos podem constituir um subgrupo distinto é uma questão para investigação clínica adicional, mas esses resultados sugerem que alguns perfis comportamentais entre aqueles com diagnóstico de TDAH podem responder de forma diferente a tratamentos que visam sistemas de atenção diferentes.
Alcançamos uma precisão de classificação superior em comparação com esses estudos anteriores e atribuímos essa melhoria a vários fatores: Primeiro, conforme demonstrado por Dey et al. (2012), a restrição de nossas análises a voxels relevantes para a tarefa usando uma máscara funcional reduziu o ruído entre os recursos do classificador e provavelmente otimizou o desempenho do modelo. Em segundo lugar, e de forma relacionada, há uma forte conexão teórica entre os processos inibitórios implícitos na tarefa de fMRI go / no-go e tanto o IGT quanto o TDAH. Ao focar nos substratos neurais que suportam esses processos, nossas análises podem ter sido mais propensas a identificar padrões de conectividade mutuamente preditivos. Terceiro, nossa medida de XMI pode ser mais sensível às relações de coativação não linear. Finalmente, os modelos de feedforward multicamadas têm a flexibilidade computacional para codificar relacionamentos condicionais que os classificadores SVM lineares não podem, construindo internamente uma representação de dimensão inferior dos dados de entrada que é otimizada em relação à decisão de classificação. Com vários subtipos, é amplamente aceito que o TDAH não é um transtorno monolítico, e diferentes dinâmicas de rede podem estar subjacentes a diferentes subtipos. Demonstramos aqui os benefícios da maior flexibilidade e sensibilidade proporcionada pelas redes multicamadas em relação às suas contrapartes mais simples, e recomendamos sua aplicação para responder a perguntas que não podem ser abordadas por abordagens mais convencionais, como SVMs e regressão logística.
Conclusão
A alta precisão de classificação, diagnóstico e especificidade de nossos modelos de classificadores multicamadas mostram que o TDAH é previsto de forma confiável por conectividade funcional baseada em tarefas. A predição simultânea do desempenho do IGT sugere que o diagnóstico do IGT é atribuível à sua confiança compartilhada em conexões funcionais clinicamente diagnósticas. Nossa precisão aprimorada em relação aos estudos anteriores destaca a importância das conexões envolvendo regiões positivas para a tarefa e de relações não lineares na compreensão da dinâmica do processamento neural. Nossa análise de rede de múltiplas restrições é generalizável para outras avaliações e domínios comportamentais e pode orientar o desenvolvimento de estratégias de intervenção mais eficazes.
Declaração de disponibilidade de dados
Os dados usados na preparação deste artigo foram obtidos do NIH Pediatric MRI Data Repository criado pelo NIH MRI Study of Normal Brain Development ( https://nda.nih.gov/ ). Este é um estudo longitudinal multisite de crianças com desenvolvimento típico desde o recém-nascido até a idade adulta, conduzido pelo Brain Development Cooperative Group e apoiado pelo Instituto Nacional de Saúde Infantil e Desenvolvimento Humano, Instituto Nacional de Abuso de Drogas, Instituto Nacional de Saúde Mental , e o Instituto Nacional de Doenças Neurológicas e AVC (contratos nº N01-HD02-3343, N01-MH9-0002 e N01-NS-9-2314, -2315, -2316, -2317, -2319 e -2320) . Uma lista dos sites participantes e uma lista completa dos investigadores do estudo podem ser encontradas emhttp://pediatricmri.nih.gov/nihpd/info/participating_centers.html .
Contribuições do autor
CM concebeu e supervisionou a análise de dados, codificação e tarefas computacionais, e assumiu a responsabilidade primária pela redação do manuscrito com a contribuição de CJ e JH. CJ elaborou os detalhes técnicos e implementou o modelo computacional com a entrada de CM. DH auditou e executou uma validação ingênua do modelo computacional e do código do modelo computacional otimizado para Python 3.x para melhorar a legibilidade e manutenção. JH forneceu o foco conceitual inicial e auxiliou na redação do manuscrito. Todos os autores contribuíram com o artigo e aprovaram a versão submetida.
Conflito de interesses
Os autores declaram que a pesquisa foi realizada na ausência de quaisquer relações comerciais ou financeiras que pudessem ser interpretadas como um potencial conflito de interesses.
Financiamento. Os autores não receberam financiamento para este projeto de análise de dados. A coleta de dados e o compartilhamento dos dados usados neste projeto foram financiados pelo NIDA MTA Neuroimaging Study (National Institute on Drug Abuse Grant Contract No. HHSN271200800009C seguido por um subsídio para análise de dados (DA039881). Repositório de dados de ressonância magnética pediátrica, conforme observado na declaração de disponibilidade de dados.
Referências
- Abarbanel H., Gollub J. (1996). Análise de dados caóticos observados. Phys. Hoje 49 : 81 . [ Google Scholar ]
- Andrews-Hanna JR, Reidler JS, Sepulcre J., Poulin R., Buckner RL (2010). Fracionamento funcional-anatômico da rede padrão do cérebro. Neuron 65 550–562. 10.1016 / j.neuron.2010.02.005 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Bechara A., Damasio AR, Damasio H., Anderson SW (1994). Insensibilidade a consequências futuras após danos ao córtex pré-frontal humano. Cognition 50 7-15. 10.1016 / 0010-0277 (94) 90018-3 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Bechara A., Damasio H., Tranel D., Damasio AR (2005). The Iowa Gambling Task e a hipótese do marcador somático: algumas perguntas e respostas. Trends Cogn. Sci. 9 159–162. 10.1016 / j.tics.2005.02.002 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Bell AS (2010). Uma revisão crítica dos critérios de diagnóstico do TDAH: o que abordar no DSM-V. J. Atten. Desordem. 15 3–10. 10.1177 / 1087054710365982 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Bonelli RM, Cummings JL (2007). Circuito e comportamento frontal-subcortical. Dialogues Clin. Neurosci. 9 141–151. 10.31887 / dcns.2007.9.2 / rbonelli [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Buckner RL, Andrews-Hanna JR, Schacter DL (2008). A rede padrão do cérebro: anatomia, função e relevância para a doença. Ann. NY Acad. Sci. 1124 1–38. 10.1196 / annals.1440.011 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Bullmore E. (2012). O futuro da ressonância magnética funcional na medicina clínica. Neuroimage 62 1267–1271. 10.1016 / j.neuroimage.2012.01.026 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Castellanos FX, Aoki Y. (2016). Conectividade funcional intrínseca no transtorno de déficit de atenção / hiperatividade: uma ciência em desenvolvimento. Biol. Psychiatry Cogn. Neurosci. Neuroimaging 1 253–261. 10.1016 / j.bpsc.2016.03.004 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Castellanos FX, Proal E. (2012). Sistemas cerebrais em larga escala no TDAH: além do modelo pré-frontal-estriatal. Trends Cogn. Sci. 16 17–26. 10.1016 / j.tics.2011.11.007 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Castellanos FX, Tannock R. (2002). Neurociência do transtorno de déficit de atenção / hiperatividade: a busca de endofenótipos. Nat. Rev. Neurosci. 3 617–628. 10.1038 / nrn896 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Cheng W., Ji X., Zhang J., Feng J. (2012). Classificação individual de pacientes com TDAH, integrando marcadores de neuroimagem multiescalares e técnicas avançadas de reconhecimento de padrões. Frente. Syst. Neurosci. 6 : 58 . 10.3389 / fnsys.2012.00058 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Chow TW, Cummings JL (1999). “ Frontal-subcortical circuits ,” em The Human Frontal Lobes: Functions and Disorders , eds Miller BL, Cummings JL (London: Guilford Press;), 3-26. [ Google Scholar ]
- Christoff K., Gordon AM, Smallwood J., Smith R., Schooler JW (2009). A amostragem de experiência durante o fMRI revela a rede padrão e as contribuições do sistema executivo para a mente errante. Proc. Natl. Acad. Sci. USA 106 8719–8724. 10.1073 / pnas.0900234106 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Colby J., Rudie J., Brown J., Douglas P., Cohen M., Shehzad Z. (2012). Insights sobre a classificação de imagens multimodais do TDAH. Frente. Syst. Neurosci. 6 : 59 . 10.3389 / fnsys.2012.00059 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Damásio AR (1994). Erro de Descartes: Emoção, Racionalidade e o Cérebro Humano. New York, NY: Putnam. [ Google Scholar ]
- Damásio AR (1996). A hipótese do marcador somático e as possíveis funções do córtex pré-frontal. Philos. Trans. R. Soc. Lond. B Biol. Sci. 351 1413–1420. 10.1098 / rstb.1996.0125 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- DeMers D., Cottrell GW (1993). Redução da dimensionalidade não linear. Artigo apresentado no Advances in Neural Information Processing Systems , La Jolla, CA. [ Google Scholar ]
- Dey S., Rao AR, Shah M. (2012). Explorando a estrutura de rede do cérebro na identificação de sujeitos com TDAH. Frente. Syst. Neurosci. 6 : 75 . 10.3389 / fnsys.2012.00075 [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Du Y., Fu Z., Calhoun VD (2018). Classificação e previsão de distúrbios cerebrais usando conectividade funcional: promissor, mas desafiador. Frente. Neurosci. 12 : 525 . 10.3389 / fnins.2018.00525 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Ergül C., Ulasoglu-Yildiz C., Kurt E., Koyuncu A., Kicik A., Demiralp T., et al. (2019). Conectividade funcional intrínseca no transtorno de ansiedade social com e sem transtorno de déficit de atenção e hiperatividade comórbido. Brain Res. 1722 : 146364 . 10.1016 / j.brainres.2019.146364 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Fair DA, Cohen AL, Dosenbach NU, Church JA, Miezin FM, Barch DM, et al. (2008). A arquitetura em desenvolvimento da rede padrão do cérebro. Proc. Natl. Acad. Sci. USA 105 4028–4032. 10.1073 / pnas.0800376105 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Fortes D., Figueiredo T., Lima G., Segenreich D., Serra-Pinheiro MA, Mattos P. (2020). Desconsiderar o prejuízo no diagnóstico de TDAH aumenta sua prevalência. J. Atten. Desordem. 10.1177 / 1087054720911969 [Epub ahead of print]. [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Fransson P. (2005). Flutuações espontâneas do sinal BOLD de baixa frequência: uma investigação de fMRI do modo padrão do estado de repouso da hipótese da função cerebral. Zumbir. Brain Mapp. 26 15–29. 10.1002 / hbm.20113 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Garon N., Moore C., Waschbusch DA (2006). Tomada de decisão em crianças apenas com TDAH, ansiosas / deprimidas com TDAH e crianças controle usando uma versão infantil do Iowa Gambling Task. J. Atten. Desordem. 9 607–619. 10.1177 / 1087054705284501 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Gonzalez-Castillo J., Bandettini PA (2018). Conectividade funcional dinâmica baseada em tarefas: descobertas recentes e questões em aberto. Neuroimage 180 (Pt B), 526-533. 10.1016 / j.neuroimage.2017.08.006 [ artigo grátis PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Graham SA, Madigan S. (2016). Preenchendo as lacunas no estudo do desenvolvimento cognitivo típico e atípico: um comentário. J. Cogn. Dev. 17 671–681. 10.1080 / 15248372.2016.1200898 [ CrossRef ] [ Google Scholar ]
- Groen Y., Gaastra GF, Lewis-Evans B., Tucha O. (2013). Comportamento de risco em tarefas de jogo em indivíduos com TDAH - uma revisão sistemática da literatura. PLoS One 8 : e74909 . 10.1371 / journal.pone.0074909 [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Guo X., Yao D., Cao Q., Liu L., Zhao Q., Li H., et al. (2020). Conectividade funcional de repouso compartilhada e distinta em crianças e adultos com transtorno de déficit de atenção / hiperatividade. Tradução Psychiatry 10 : 65 . 10.1038 / s41398-020-0740-y [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Hagmann P., Cammoun L., Gigandet X., Meuli R., Honey CJ, Wedeen VJ, et al. (2008). Mapeando o núcleo estrutural do córtex cerebral humano. PLoS Biol. 6 : e159 . 10.1371 / journal.pbio.0060159 [ artigo grátis PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Hagmann P., Sporns O., Madan N., Cammoun L., Pienaar R., Wedeen VJ, et al. (2010). A maturação da matéria branca remodela a conectividade estrutural no cérebro humano em desenvolvimento tardio. Proc. Natl. Acad. Sci. USA 107 19067–19072. 10.1073 / pnas.1009073107 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Hawkins DM (2004). O problema de overfitting. J. Chem. Information Comput. Sci. 44 1–12. 10.1021 / ci0342472 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Honey CJ, Sporns O., Cammoun L., Gigandet X., Thiran JP, Meuli R., et al. (2009). Prever conectividade funcional em estado de repouso humano a partir da conectividade estrutural. Proc. Natl. Acad. Sci. USA 106 2035–2040. 10.1073 / pnas.0811168106 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Hwang S., Meffert H., Parsley I., Tyler PM, Erway AK, Botkin ML, et al. (2019). Segregando a atenção sustentada da inibição da resposta no TDAH: um estudo de fMRI. Neuroimage Clin. 21 : 101677 . 10.1016 / j.nicl.2019.101677 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Hyvärinen A., Bingham E. (2003). Conexão entre perceptrons multicamadas e regressão usando análise de componentes independentes. Neurocomputing 50 211–222. 10.1016 / S0925-2312 (01) 00705-6 [ CrossRef ] [ Google Scholar ]
- Ioffe S., Szegedy C. (2015). Normalização em lote: acelerando o treinamento de rede profunda, reduzindo a mudança de covariável interna. arXiv [ Pré- impressão]. Disponível online em: https://arxiv.org/abs/1502.03167 (acessado em 25 de fevereiro de 2020). [ Google Scholar ]
- Jung M., Tu Y., Park J., Jorgenson K., Lang C., Song W., et al. (2019). Conectividade funcional em repouso compartilhada e distinta baseada na superfície no transtorno do déficit de atenção e hiperatividade e no transtorno do espectro do autismo. Br. J. Psychiatry 214 339–344. 10.1192 / bjp.2018.248 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Kline DM, Berardi VL (2005). Revisitando funções de erro quadrático e entropia cruzada para treinamento de classificadores de redes neurais. Neural Comput. Appl. 14 310–318. 10.1007 / s00521-005-0467-y [ CrossRef ] [ Google Scholar ]
- Knudde N., van der Herten J., Dhaene T., Couckuyt I. (2017). GPflowOpt: uma biblioteca de otimização Bayesiana usando tensorflow. arXiv [ Pré- impressão]. Disponível online em: https://arxiv.org/abs/1711.03845#:~:text=A%20novel%20Python%20framework%20for,GPU%20computations%20for%20Bayesian%20optimization (acessado em 16 de abril de 2020). [ Google Scholar ]
- Konrad K., Eickhoff SB (2010). O cérebro com TDAH está conectado de maneira diferente? Uma revisão sobre conectividade estrutural e funcional no transtorno de déficit de atenção e hiperatividade. Zumbir. Brain Mapp. 31 904–916. 10.1002 / hbm.21058 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Li W. (1990). Funções de informação mútua versus funções de correlação. J. Stat. Phys. 60 823–837. 10.1007 / bf01025996 [ CrossRef ] [ Google Scholar ]
- Lin C.-H., Chiu Y.-C., Cheng C.-M., Hsieh J.-C. (2008). Mapas cerebrais da tarefa de jogo de Iowa. BMC Neurosci. 9 : 72 . 10.1186 / 1471-2202-9-72 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Lin C.-H., Wang C.-C., Sun J.-H., Ko C.-H., Chiu Y.-C. (2019). A versão clínica da tarefa de jogo de iowa é relevante para avaliar o comportamento de escolha em casos de dependência de internet? Frente. Psychiatry 10 : 232 . 10.3389 / fpsyt.2019.00232 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Liu M., Wu W., Gu Z., Yu Z., Qi F., Li Y. (2018). Aprendizado profundo baseado na normalização em lote para detecção do sinal P300. Neurocomputing 275 288–297. 10.1016 / j.neucom.2017.08.039 [ CrossRef ] [ Google Scholar ]
- Lotlikar R., Kothari R. (2000). A otimização de Bayes motivou a redução da dimensionalidade baseada em perceptron linear e multicamadas. IEEE Trans. Neural Netw. 11 452–463. 10.1109 / 72.839014 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Luengo J., García S., Herrera F. (2009). Um estudo sobre a utilização de testes estatísticos para experimentação com redes neurais: análise de condições de teste paramétricas e testes não paramétricos. Expert Syst. Appl. 36 7798–7808. 10.1016 / j.eswa.2008.11.041 [ CrossRef ] [ Google Scholar ]
- Mason MF, Norton MI, Van Horn JD, Wegner DM, Grafton ST, Macrae CN (2007). Mentes errantes: a rede padrão e o pensamento independente de estímulos. Science 315 393–395. 10.1126 / science.1131295 [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Mayes SD, Calhoun SL, Crowell EW (2000). Dificuldades de aprendizagem e TDAH: transtornos de espectro sobrepostos. J. Aprenda. Disabil. 33 417–424. 10.1177 / 002221940003300502 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- McNorgan C., Joanisse MF (2014). Uma abordagem conexionista para mapear o conectoma humano permite simulações da atividade neural dentro de um cérebro artificial. Brain Connect. 4 40–52. [ PubMed ] [ Google Scholar ]
- McNorgan C., Smith GJ, Edwards ES (2020). Integrando conectividade funcional e MVPA por meio de uma análise de rede de múltiplas restrições. Neuroimage 208 : 116412 . 10.1016 / j.neuroimage.2019.116412 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Michelini G., Jurgiel J., Bakolis I., Cheung CH, Asherson P., Loo SK, et al. (2019). Conectividade funcional atípica em adolescentes e adultos com TDAH persistente e remitido durante uma tarefa de controle cognitivo. Tradução Psychiatry 9 : 137 . [ Artigo grátis PMC ] [ PubMed ] [ Google Scholar ]
- Grupo Cooperativo MTA (1999). Um ensaio clínico randomizado de 14 meses de estratégias de tratamento para transtorno de déficit de atenção / hiperatividade. O Grupo Cooperativo MTA. Estudo de tratamento multimodal de crianças com TDAH. Arco. Gen. Psychiatry 56 1073–1086. 10.1001 / archpsyc.56.12.1073 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Nieto-Castanon A. (2020). Manual de métodos de imagem por ressonância magnética de conectividade funcional em CONN. Boston, MA: Hilbert Press. [ Google Scholar ]
- Norman LJ, Carlisi CO, Christakou A., Murphy CM, Chantiluke K., Giampietro V., et al. (2018). Disfunção frontostriatal durante a tomada de decisão no transtorno de déficit de atenção / hiperatividade e transtorno obsessivo-compulsivo. Biol. Psychiatry Cogn. Neurosci. Neuroimaging 3 694–703. 10.1016 / j.bpsc.2018.03.009 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Paluš M. (1997). Detectando a sincronização de fase em sistemas ruidosos. Phys. Lett. A 235 341–351. 10.1016 / S0375-9601 (97) 00635-X [ CrossRef ] [ Google Scholar ]
- Rasmussen J., Casey B., van Erp TG, Tamm L., Epstein JN, Buss C., et al. (2016). TDAH e uso de cannabis em adultos jovens examinados usando fMRI de uma tarefa Go / NoGo. Brain Imaging Behav. 10 761–771. 10.1007 / s11682-015-9438-9 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Roshani F., Piri R., Malek A., Michel TM, Vafaee MS (2020). Comparação de flexibilidade cognitiva, risco adequado e tempo de reação em indivíduos com e sem TDAH adulto. Psychiatry Res. 284 : 112494 . 10.1016 / j.psychres.2019.112494 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Sato JR, Hoexter MQ, Castellanos FX, Rohde LA (2012). Padrões de conectividade cerebral anormais em adultos com TDAH: um estudo de coerência. PLoS One 7 : e45671 . 10.1371 / journal.pone.0045671 [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Scott DW (1979). Em histogramas ideais e baseados em dados. Biometrika 66 605–610. 10.1093 / biomet / 66.3.605 [ CrossRef ] [ Google Scholar ]
- Shorten C., Khoshgoftaar TM (2019). Uma pesquisa sobre aumento de dados de imagem para aprendizado profundo. J. Big Data 6 : 60 10.1186 / s40537-019-0197-0 [ CrossRef ] [ Google Scholar ]
- Simmonds DJ, Pekar JJ, Mostofsky SH (2008). Meta-análise de tarefas Go / No-go demonstrando que a ativação de fMRI associada à inibição da resposta é dependente da tarefa. Neuropsychologia 46 224–232. 10.1016 / j.neuropsychologia.2007.07.015 [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Stark R., Bauer E., Merz C., Zimmermann M., Reuter M., Plichta M., et al. (2011). Comportamentos relacionados ao TDAH estão associados à ativação do cérebro no sistema de recompensa. Neuropsychologia 49 426–434. 10.1016 / j.neuropsychologia.2010.12.012 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Suskauer SJ, Simmonds DJ, Caffo BS, Denckla MB, Pekar JJ, Mostofsky SH (2008). fMRI de variação intrasujeito no TDAH: atividade pré-motora anômala com compensação pré-frontal. Geléia. Acad. Child Adolesc. Psychiatry 47 1141–1150. 10.1097 / CHI.0b013e3181825b1f [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Tian L., Jiang T., Wang Y., Zang Y., He Y., Liang M., et al. (2006). Padrões alterados de conectividade funcional em estado de repouso do córtex cingulado anterior em adolescentes com transtorno de déficit de atenção e hiperatividade. Neurosci. Lett. 400 39–43. 10.1016 / j.neulet.2006.02.022 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Todd RD, Huang H., Todorov AA, Neuman RJ, Reiersen AM, Henderson CA, et al. (2008). Preditores de estabilidade de subtipos de transtorno de déficit de atenção / hiperatividade desde a infância até a idade adulta jovem. Geléia. Acad. Child Adolesc. Psychiatry 47 76–85. 10.1097 / chi.0b013e31815a6aca [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Tomasi D., Volkow ND (2011). Centros de conectividade funcional no cérebro humano. Neuroimage 57 908–917. 10.1016 / j.neuroimage.2011.05.024 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Tomasi D., Volkow ND (2012). Conectividade funcional anormal em crianças com transtorno de déficit de atenção / hiperatividade. Biol. Psychiatry 71 443–450. 10.1016 / j.biopsych.2011.11.003 [ artigo grátis PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Toplak ME, Sorge GB, Benoit A., West RF, Stanovich KE (2010). Habilidades cognitivas e de tomada de decisão: uma revisão das associações entre o desempenho do Iowa Gambling Task, as funções executivas e a inteligência. Clin. Psychol. Rev. 30 562–581. 10.1016 / j.cpr.2010.04.002 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Voeller KK (2004). Transtorno de déficit de atenção e hiperatividade (TDAH). J. Child Neurol. 19 798–814. [ PubMed ] [ Google Scholar ]
- Wang XH, Jiao Y., Li L. (2018). Identificar indivíduos com transtorno de déficit de atenção e hiperatividade com base na variabilidade temporal da conectividade funcional dinâmica. Sci. Rep. 8 : 11789 . 10.1038 / s41598-018-30308-w [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Wollstadt P., Martínez-Zarzuela M., Vicente R., Díaz-Pernas FJ, Wibral M. (2014). Análise de entropia de transferência eficiente de séries temporais neurais não estacionárias. PLoS One 9 : e102833 . 10.1371 / journal.pone.0102833 [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Yang DY, Chi MH, Chu CL, Lin CY, Hsu SE, Chen KC, et al. (2019). Disfunção orbitofrontal durante o processo de recompensa em adultos com TDAH: um estudo de fMRI. Clin. Neurophysiol. 130 627–633. 10.1016 / j.clinph.2019.01.022 [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Yeo BTT, Krienen FM, Sepulcre J., Sabuncu MR, Lashkari D., Hollinshead M., et al. (2011). A organização do córtex cerebral humano estimada por conectividade funcional intrínseca. J. Neurophysiol. 106 1125–1165. 10.1152 / jn.00338.2011 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
- Zeng L.-L., Wang D., Fox MD, Sabuncu M., Hu D., Ge M., et al. (2014). Bases neurobiológicas do movimento da cabeça em imagens cerebrais. Proc. Natl. Acad. Sci. USA 111 6058–6062. 10.1073 / pnas.1317424111 [ artigo gratuito PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
Nenhum comentário:
Postar um comentário