Sensores gerados por IA abrem novos caminhos para a detecção precoce do câncer.

Anne Trafton | MIT News
Detectar o câncer nos estágios mais iniciais poderia reduzir drasticamente as mortes pela doença, já que os tumores costumam ser mais fáceis de tratar quando identificados precocemente. Para ajudar a alcançar esse objetivo, pesquisadores do MIT e da Microsoft estão utilizando inteligência artificial para projetar sensores moleculares voltados à detecção precoce.
Os pesquisadores desenvolveram um modelo de IA para projetar peptídeos (proteínas curtas) que são alvo de enzimas chamadas proteases, as quais apresentam atividade excessiva em células cancerígenas. Nanopartículas revestidas com esses peptídeos podem atuar como sensores que emitem um sinal caso proteases associadas ao câncer estejam presentes em qualquer parte do corpo.
Dependendo de quais proteases forem detectadas, os médicos poderiam diagnosticar o tipo específico de câncer presente. Esses sinais poderiam ser identificados por meio de um simples exame de urina, que poderia até ser realizado em casa.
“Estamos focados em uma detecção ultrassensível em doenças como os estágios iniciais do câncer, quando a carga tumoral é pequena, ou logo no início de uma recorrência após a cirurgia”, afirma Sangeeta Bhatia, professora John e Dorothy Wilson de Ciências da Saúde e Tecnologia e de Engenharia Elétrica e Ciência da Computação no MIT, além de integrante do Instituto Koch para Pesquisa Integrativa do Câncer e do Instituto de Engenharia Médica e Ciência (IMES) do MIT.
Bhatia e Ava Amini ’16, pesquisadora principal da Microsoft Research e ex-aluna de pós-graduação do laboratório de Bhatia, são as autoras sênior do estudo, publicado na revista Nature Communications. Carmen Martin-Alonso, PhD ’23, cientista fundadora da Amplifyer Bio, e Sarah Alamdari, cientista sênior de aplicações na Microsoft Research, são as autoras principais do artigo.
Amplificando os sinais do câncer
Há mais de uma década, o laboratório de Bhatia teve a ideia de utilizar a atividade das proteases como um marcador de câncer em estágio inicial. O genoma humano codifica cerca de 600 proteases, que são enzimas capazes de cortar outras proteínas, incluindo proteínas estruturais como o colágeno. Elas costumam apresentar atividade excessiva em células cancerígenas, pois ajudam essas células a escapar de seus locais de origem ao degradar proteínas da matriz extracelular, que normalmente mantêm as células no lugar.
A ideia dos pesquisadores foi revestir nanopartículas com peptídeos que podem ser clivados por uma protease específica. Essas partículas poderiam então ser ingeridas ou inaladas. À medida que percorressem o corpo, se encontrassem proteases associadas ao câncer, os peptídeos presentes nas partículas seriam clivados.
Esses peptídeos seriam excretados na urina, onde poderiam ser detectados por meio de uma tira de papel semelhante às usadas em testes de gravidez. A medição desses sinais revelaria a atividade excessiva de proteases em regiões profundas do corpo.
“Temos avançado a ideia de que, se for possível criar um sensor a partir dessas proteases e multiplexá-las, então seria possível identificar assinaturas de onde essas proteases estavam ativas nas doenças. E, como a clivagem do peptídeo é um processo enzimático, ela pode realmente amplificar um sinal”, afirma Bhatia.
Os pesquisadores já utilizaram essa abordagem para demonstrar sensores diagnósticos para câncer de pulmão, ovário e cólon.
No entanto, nesses estudos, foi empregado um processo de tentativa e erro para identificar peptídeos que pudessem ser clivados por determinadas proteases. Na maioria dos casos, os peptídeos identificados podiam ser clivados por mais de uma protease, o que significava que os sinais obtidos não podiam ser atribuídos a uma enzima específica.
Ainda assim, o uso de conjuntos “multiplexados” com muitos peptídeos diferentes resultou em assinaturas de sensores distintas, que se mostraram diagnósticas em modelos animais de diversos tipos de câncer, mesmo quando a identidade exata das proteases responsáveis pela clivagem permanecia desconhecida.
No novo estudo, os pesquisadores foram além do processo tradicional de tentativa e erro ao desenvolver um sistema inovador de IA, chamado CleaveNet, para projetar sequências de peptídeos que possam ser clivadas de forma eficiente e específica pelas proteases-alvo de interesse.
Os usuários podem fornecer ao CleaveNet critérios de design, e o sistema gera peptídeos candidatos com alta probabilidade de atender a esses requisitos. Dessa forma, o CleaveNet permite ajustar a eficiência e a especificidade dos peptídeos gerados pelo modelo, abrindo caminho para aprimorar o poder diagnóstico dos sensores.
“Se soubermos que uma protease específica é realmente fundamental para um determinado tipo de câncer, e conseguirmos otimizar o sensor para ser altamente sensível e específico a essa protease, então teremos um excelente sinal diagnóstico”, afirma Amini. “Podemos explorar o poder da computação para otimizar especificamente essas métricas de eficiência e seletividade.”
Para um peptídeo que contém 10 aminoácidos, existem cerca de 10 trilhões de combinações possíveis. O uso de IA para explorar esse espaço imenso permite prever, testar e identificar sequências úteis de forma muito mais rápida do que seria possível para humanos, além de reduzir consideravelmente os custos experimentais.
Prevendo a atividade enzimática
Para criar o CleaveNet, os pesquisadores desenvolveram um modelo de linguagem de proteínas capaz de prever sequências de aminoácidos de peptídeos, de maneira análoga à forma como grandes modelos de linguagem preveem sequências de texto. Como dados de treinamento, eles utilizaram informações disponíveis publicamente sobre cerca de 20 mil peptídeos e suas interações com diferentes proteases de uma família conhecida como metaloproteinases de matriz (MMPs).
Com base nesses dados, os pesquisadores treinaram um modelo para gerar sequências de peptídeos que, segundo previsões, seriam clivadas por proteases. Essas sequências podiam então ser inseridas em outro modelo, que previa com que eficiência cada peptídeo seria clivado por qualquer protease de interesse.
Para demonstrar essa abordagem, os pesquisadores concentraram-se em uma protease chamada MMP13, que as células cancerígenas utilizam para degradar o colágeno e facilitar a metástase a partir de seus locais de origem. Ao direcionar o CleaveNet para a MMP13 como alvo, os modelos conseguiram projetar peptídeos que podiam ser clivados por essa protease com alta seletividade e eficiência. Esse perfil de clivagem é particularmente útil para aplicações diagnósticas e terapêuticas.
“Quando configuramos o modelo para gerar sequências que fossem eficientes e seletivas para a MMP13, ele acabou criando peptídeos que nunca haviam sido observados nos dados de treinamento e, ainda assim, essas novas sequências se mostraram eficientes e seletivas”, afirma Martin-Alonso. “Foi muito empolgante ver isso.”
Segundo os pesquisadores, esse tipo de seletividade pode ajudar a reduzir o número de peptídeos diferentes necessários para diagnosticar um determinado tipo de câncer, identificar novos biomarcadores e fornecer insights sobre vias biológicas específicas para estudos e testes terapêuticos.
Atualmente, o laboratório de Bhatia integra um projeto financiado pela ARPA-H para criar “repórteres” destinados a um kit de diagnóstico domiciliar que, potencialmente, poderia detectar e diferenciar até 30 tipos distintos de câncer em estágios iniciais da doença, com base na medição da atividade de proteases. Esses sensores poderiam incluir não apenas a detecção de clivagem mediada por MMPs, mas também de outras enzimas, como proteases serinas e proteases cisteínas.
Os peptídeos projetados com o auxílio do CleaveNet também poderiam ser incorporados a terapias contra o câncer, como tratamentos com anticorpos. O uso de um peptídeo específico para ligar um agente terapêutico — como uma citocina ou um fármaco de pequena molécula — a um anticorpo direcionador poderia permitir que o medicamento fosse liberado apenas quando os peptídeos fossem expostos às proteases presentes no ambiente tumoral, aumentando a eficácia e reduzindo os efeitos colaterais.
- Veja também: Novo sistema de IA pode acelerar a pesquisa clínica
Além das aplicações diretas em diagnóstico e terapias, a combinação dos esforços do projeto da ARPA-H com esse arcabouço de modelagem pode possibilitar a criação de um abrangente “atlas de atividade de proteases”, cobrindo múltiplas classes de proteases e diferentes tipos de câncer. Um recurso desse tipo poderia acelerar ainda mais as pesquisas em detecção precoce do câncer, biologia das proteases e modelos de IA para o design de peptídeos.
A pesquisa foi financiada pela Fundação La Caixa, pelo Ludwig Center do MIT e pelo Marble Center for Cancer Nanomedicine.
Reimpresso com permissão do MIT News






