Um novo estudo apresenta uma abordagem inovadora para a detecção crítica de lesões pré-cancerosas usando imagens grandes e de alta resolução. Uma equipa de investigadores de Portugal desenvolveu uma solução de aprendizagem automática que ajuda os patologistas a detetar displasia cervical e automatiza totalmente o diagnóstico de novas amostras. É um dos primeiros trabalhos publicados a usar slides completos.
Segundo a Organização Mundial da Saúde (OMS), o câncer cervical é o quarto câncer mais comum em mulheres, com uma estimativa de 604.000 novos casos em 2020. No entanto, também é um dos tipos de câncer mais evitáveis e tratáveis, se detectado precocemente e tratado adequadamente. Portanto, a triagem e detecção de lesões pré-cancerosas (e vacinação) são cruciais para prevenir a doença.
Mas e se pudéssemos desenvolver modelos de aprendizado de máquina para ajudar a classificar subjetivamente as lesões no epitélio escamoso – o tipo de epitélio que tem funções protetoras contra microorganismos – usando imagens de slides inteiras (WSI) que contêm informações de todo o tecido?
Pensando nisso, uma equipe de pesquisadores do Instituto de Engenharia de Sistemas e Computação, Tecnologia e Ciência (INESC TEC) e do Laboratório de Patologia Molecular e Anatômica IMP Diagnostics em Portugal desenvolveu uma metodologia fracamente supervisionada – uma técnica de aprendizado de máquina que combinava dados anotados e não anotados durante o treinamento do modelo – para graduar a displasia cervical.
Isso é particularmente útil porque é difícil obter anotações sobre dados de patologia: as imagens são enormes, o que torna o processo de anotação muito demorado e tedioso, além de sua alta subjetividade. Esse tipo de técnica permite que os pesquisadores desenvolvam modelos com bom desempenho, mesmo que algumas informações faltem durante a fase de treinamento do modelo.
O modelo então classifica a displasia cervical, o crescimento anormal de células na superfície, como lesões intraepiteliais escamosas de baixo grau (LSIL) ou de alto grau (HSIL).
“Na detecção da displasia cervical, este foi um dos primeiros trabalhos publicados a utilizar as lâminas completas e seguiu uma abordagem que envolveu a segmentação e depois a classificação das áreas de interesse, tornando o diagnóstico de novas peças totalmente automatizado”, explicou Sara Oliveira , Investigador do INESC TEC.
Esse processo de classificação é complexo e pode ser subjetivo. Portanto, o desenvolvimento de modelos de aprendizado de máquina pode auxiliar os patologistas nessa tarefa; Além disso, o diagnóstico auxiliado por computador (CAD) desempenha um papel importante: esses sistemas podem servir como a primeira indicação de casos suspeitos e alertar os patologistas para casos que devem ser examinados mais de perto.
Sara Oliveira enfatizou que mesmo o desenvolvimento de sistemas CAD para apoio à decisão em patologia digital está longe de estar totalmente resolvido. “De fato, a patologia computacional ainda é um campo relativamente jovem, com muitos desafios que precisam ser resolvidos para que os modelos de aprendizado de máquina abordem efetivamente a aplicabilidade clínica”, disse ela.
Há também uma desvantagem ao usar o WSI, e as abordagens mais comuns se concentram no corte manual de áreas menores dos slides. WSI são geralmente imagens grandes e de alta resolução (geralmente maiores que 50.000 × 50.000 pixels); Portanto, eles não se adaptam facilmente às unidades de processamento gráfico (GPU) usadas para treinar modelos de aprendizado profundo.
“Apesar dos resultados promissores, o fato de essas abordagens exigirem a seleção manual das áreas a serem classificadas e se concentrarem apenas em pequenas regiões (considerando o tamanho do slide) as torna mais vulneráveis do ponto de vista da implementação”, disse o pesquisador.
Como treinar o modelo de segmentação
A estrutura inclui uma etapa de segmentação epitelial seguida de um classificador de displasia (não neoplásica, LSIL, HSIL), tornando a pontuação da lâmina totalmente automatizada sem a necessidade de identificação manual de áreas epiteliais. “A abordagem de classificação proposta alcançou uma precisão equilibrada de 71,07% e sensibilidade de 72,18% quando testada no nível da lâmina em 600 espécimes independentes”, explicou o principal autor do estudo.
Para treinar o modelo de segmentação, os pesquisadores usaram todas as lâminas anotadas (186) com um total de 312 fragmentos de tecido. Os resultados mostram que “apenas muito raramente o modelo perde uma grande porção do epitélio ou identifica erroneamente uma área significativa”.
Após a primeira etapa de segmentação, os pesquisadores focaram a classificação nas ROIs identificadas, o que possibilitou o uso de WSI não anotados para treinamento e diagnóstico automático de casos invisíveis. O classificador pode então usar os ladrilhos dessas áreas para diagnosticar o grau de displasia.
Esta solução usou 383 regiões epiteliais anotadas para treinar o modelo de classificação, divididas em conjuntos de treinamento e validação. Os pesquisadores testaram diferentes modelos e depois de escolher o melhor modelo, eles retreinaram a versão adicionando alguns blocos individuais rotulados ao conjunto de treinamento (263) para aproveitar a tarefa de aprendizado de classificação. Ao combinar os ladrilhos selecionados de cada área epitelial, que trazem apenas o rótulo da bolsa correspondente, com ladrilhos associados a um rótulo específico, o processo de seleção de ladrilhos foi aprimorado.
Por fim, para usar todo o conjunto de dados, a equipe retreinou o modelo adicionando sacos de blocos dos slides não anotados (1198).
O pesquisador principal do artigo afirma que o trabalho futuro pode ter como objetivo refinar ambas as partes do modelo (segmentação e classificação) e avaliar uma abordagem totalmente integrada.
O conjunto de teste de 600 amostras usado no estudo atual foi selecionado do conjunto de dados IMP Diagnostics e está disponível “mediante solicitação razoável”.
“Na IMP Diagnostics, investimos na melhoria do diagnóstico do câncer do colo do útero e, com isso, na melhoria da saúde da mulher. Esta ferramenta é um passo mais próximo de uma detecção mais eficiente de lesões pré-malignas”, conclui Diana Montezuma Felizardo, patologista e chefe de pesquisa e desenvolvimento da IMP Diagnose.
Os resultados são publicados na revista Relatórios Científicos.
Mais Informações:
Sara P. Oliveira et al., Um sistema CAD para avaliação automatizada de displasia em varreduras completas cervicais H&E, Relatórios Científicos (2023). DOI: 10.1038/s41598-023-30497-z
Fornecido pelo INESC Bruxelas HUB
“Organizador sutilmente encantador. Ninja de TV freelancer. Leitor incurável. Empreendedor. Entusiasta de comida. Encrenqueiro incondicional.”