Novo sistema de IA pode acelerar a pesquisa clínica

Adam Zewe | MIT News
Anotar regiões de interesse em imagens médicas, um processo conhecido como segmentação, é frequentemente um dos primeiros passos que os pesquisadores clínicos realizam ao conduzir um novo estudo envolvendo imagens biomédicas.
Por exemplo, para determinar como o tamanho do hipocampo do cérebro muda conforme os pacientes envelhecem, o cientista primeiro delimita cada hipocampo em uma série de exames de imagem cerebral. Para muitas estruturas e tipos de imagem, esse processo costuma ser manual e pode ser extremamente demorado, especialmente quando as regiões estudadas são difíceis de delinear.
Para simplificar esse procedimento, pesquisadores do MIT desenvolveram um sistema baseado em inteligência artificial que permite ao pesquisador segmentar rapidamente novos conjuntos de imagens biomédicas por meio de cliques, rabiscos e caixas desenhadas sobre as imagens. Esse novo modelo de IA utiliza essas interações para prever a segmentação.
À medida que o usuário marca imagens adicionais, o número de interações necessárias diminui, até eventualmente chegar a zero. Nesse ponto, o modelo consegue segmentar cada nova imagem com precisão, sem necessidade de intervenção do usuário.
Ele consegue fazer isso porque a arquitetura do modelo foi especialmente projetada para utilizar informações de imagens já segmentadas a fim de realizar novas previsões.
Diferentemente de outros modelos de segmentação de imagens médicas, esse sistema permite ao usuário segmentar um conjunto inteiro de dados sem precisar repetir o trabalho para cada imagem.
Além disso, a ferramenta interativa não exige um conjunto de imagens pré-segmentadas para treinamento, de modo que os usuários não precisam ter conhecimento em aprendizado de máquina nem dispor de grandes recursos computacionais. É possível usar o sistema em uma nova tarefa de segmentação sem necessidade de retreinar o modelo.
A longo prazo, essa ferramenta pode acelerar estudos sobre novos métodos de tratamento e reduzir os custos de ensaios clínicos e de pesquisas médicas. Ela também pode ser utilizada por médicos para aumentar a eficiência de aplicações clínicas, como o planejamento de tratamentos com radiação.
“Muitos cientistas talvez só tenham tempo para segmentar algumas poucas imagens por dia em suas pesquisas, já que a segmentação manual é extremamente demorada. Nossa esperança é que esse sistema possibilite novas descobertas científicas, permitindo que pesquisadores clínicos realizem estudos que antes eram inviáveis pela falta de uma ferramenta eficiente”, afirma Hallee Wong, estudante de pós-graduação em engenharia elétrica e ciência da computação e autora principal de um artigo sobre a nova ferramenta.
O trabalho também conta com a participação de Jose Javier Gonzalez Ortiz, PhD ’24; John Guttag, professor Dugald C. Jackson de Ciência da Computação e Engenharia Elétrica; e do autor sênior Adrian Dalca, professor assistente na Harvard Medical School e no MGH, além de pesquisador do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT. A pesquisa será apresentada na International Conference on Computer Vision.
Simplificando a segmentação
Existem basicamente dois métodos que os pesquisadores utilizam para segmentar novos conjuntos de imagens médicas. Com a segmentação interativa, eles inserem uma imagem em um sistema de IA e usam uma interface para marcar as áreas de interesse. O modelo, então, prevê a segmentação com base nessas interações.
Uma ferramenta desenvolvida anteriormente pelos pesquisadores do MIT, chamada ScribblePrompt, permite que os usuários façam isso, mas é necessário repetir o processo para cada nova imagem.
Outra abordagem é desenvolver um modelo de IA específico para a tarefa, capaz de segmentar automaticamente as imagens. Esse método exige que o usuário segmente manualmente centenas de imagens para criar um conjunto de dados e, em seguida, treine um modelo de aprendizado de máquina. Esse modelo prevê a segmentação de uma nova imagem, mas o usuário precisa reiniciar todo o processo complexo baseado em aprendizado de máquina para cada nova tarefa, além de não haver possibilidade de corrigir o modelo caso ele cometa um erro.
Esse novo sistema, chamado MultiverSeg, combina o melhor de cada abordagem. Ele prevê a segmentação de uma nova imagem com base nas interações do usuário, como rabiscos, mas também mantém cada imagem segmentada em um conjunto de contexto ao qual recorre posteriormente.
Quando o usuário envia uma nova imagem e marca as áreas de interesse, o modelo utiliza os exemplos presentes em seu conjunto de contexto para gerar uma previsão mais precisa, com menos intervenção do usuário.
Os pesquisadores projetaram a arquitetura do modelo para trabalhar com conjuntos de contexto de qualquer tamanho, de modo que o usuário não precisa ter um número específico de imagens. Isso dá ao MultiverSeg a flexibilidade necessária para ser utilizado em uma ampla variedade de aplicações.
“Em determinado momento, para muitas tarefas, você não precisará fornecer nenhuma interação. Se houver exemplos suficientes no conjunto de contexto, o modelo consegue prever a segmentação com precisão por conta própria”, afirma Wong.
Os pesquisadores projetaram e treinaram cuidadosamente o modelo com uma coleção diversa de dados de imagens biomédicas, garantindo que ele pudesse aprimorar suas previsões de forma incremental com base nas interações do usuário.
O usuário não precisa retreinar ou personalizar o modelo para seus próprios dados. Para usar o MultiverSeg em uma nova tarefa, basta enviar uma nova imagem médica e começar a marcá-la.
Quando os pesquisadores compararam o MultiverSeg com ferramentas de ponta para segmentação de imagens interativa e baseada em contexto, ele superou todos os modelos de referência.
Menos cliques, melhores resultados
Diferentemente dessas outras ferramentas, o MultiverSeg exige menos interação do usuário a cada nova imagem. A partir da nona imagem, eram necessários apenas dois cliques para gerar uma segmentação mais precisa do que a de um modelo desenvolvido especificamente para a tarefa.
Para alguns tipos de imagem, como radiografias, o usuário pode precisar segmentar manualmente apenas uma ou duas imagens antes que o modelo se torne suficientemente preciso para fazer previsões sozinho.
A interatividade da ferramenta também permite que o usuário faça correções nas previsões do modelo, iterando até atingir o nível de precisão desejado. Em comparação com o sistema anterior dos pesquisadores, o MultiverSeg atingiu 90% de precisão usando aproximadamente 2/3 do número de rabiscos e 3/4 do número de cliques.
“Com o MultiverSeg, os usuários podem sempre fornecer mais interações para refinar as previsões da IA. Isso ainda acelera o processo de forma significativa, porque geralmente é mais rápido corrigir algo que já existe do que começar do zero”, afirma Wong.
No futuro, os pesquisadores pretendem testar a ferramenta em situações reais com colaboradores clínicos e aprimorá-la com base no feedback dos usuários. Eles também querem capacitar o MultiverSeg a segmentar imagens biomédicas em 3D.
Este trabalho é apoiado, em parte, pela Quanta Computer, Inc. e pelos National Institutes of Health, com suporte de hardware do Massachusetts Life Sciences Center.
Reproduzido com permissão do MIT News.