Em um artigo recente apresentei um caso que ilustra como a inteligência artificial tem sido usada de forma bem-sucedida na pesquisa em astronomia. Na ocasião, expus a tese de que o uso da inteligência artificial constitui um novo paradigma na metodologia da pesquisa científica. Uma prática que deve se intensificar nos próximos anos. Um exemplo que encontrei do uso da inteligência artificial na medicina reforçou ainda mais a minha convicção.
No artigo Machine learning in medicine: a practical introduction publicado na BMC Medical Research Methodology, os pesquisadores Jenni e Chris Sidey-Gibbons, fizeram uso de aprendizado de máquina, uma das áreas da inteligência artificial, para analisar amostras de células mamárias e classsificá-los como cancerígenos ou não-cancerígenos.
O conjunto de dados é o Breast Cancer Wisconsin Diagnostic Data Set. Os dados fornecem as características dos núcleos celulares de células mamárias extraídas por meio de Punção por Aspiração com Agulha Fina (PAAF). Neste procedimento, um nódulo é perfurado por uma fina agulha, com o auxílio de ultra-sonografia.
Uma amostra de tecido é extraída, podendo, então, ser analisada por patologistas. As amostras em questão foram coletadas entre janeiro de 1989 e novembro de 1990, totalizando 699 exemplares.
Para realizar a análise das amostras, foram usados os algoritmos de aprendizado supervisionado conhecidos como máquina de vetores de suporte, redes neurais artificiais e redes neurais profundas, que tem como objetivo reconhecer padrões na amostra e realizar uma classificação, neste caso específico, apresentar um diagnóstico de câncer ou células saudáveis. A idéia básica é de dar entrada com os dados de características celulares como uniformidade do tamanho e forma celulares, espessura do aglomerado, nível de adesão, morfologia dos núcleos, entre outras. No conjunto de dados ainda é possível encontrar o diagnóstico fornecido pela patologia como sendo a célula cancerígena ou não.
Os dados são separados em dois grupos, treino e teste. A máquina faz uso dos dados de treino e, por meio dos algoritmos, é capaz de reconhecer padrões entre os elementos da amostra, gerando um modelo. Com a entrada dos dados de teste, o modelo permite a classificação dos elementos desse grupo da amostra. A partir de então, aplica-se métricas de avaliação que permitem verificar o grau de eficiência do modelo. As principais métricas são precisão, que avalia o percentual total de acertos, a sensibilidade, que avalia a capacidade do método de encontrar os resultados positivos. Ou seja, o método é mais eficiente quanto maior for o número de verdadeiros positivos, isto é, aqueles resultados que o método classificou como positivo e que são realmente positivos. E a especificidade, que avalia a capacidade do método de encontrar aos resultados negativos. O método é mais eficiente quanto maior for a proporção de resultados que são classificados como negativos e que são realmente negativos. Para este conjunto de dados, o algoritmo de máquina de vetores de suporte mostrou-se o mais eficiente, com um nível de precisão de 96%, 97% de sensibilidade e 94% de especificidade.
Podemos argumentar que o índice de precisão ainda é considerado baixo no fornecimento de diagnósticos, uma vez que estamos tratando de vidas humanas. Desta forma, um erro de 4% pode ainda ser considerado elevado. No entanto, é preciso que façamos algumas ponderações.
Primeiro, o nível de erro nos diagnósticos apresentados pelas máquinas é bem próximo do erro apresentado nas análises humanas, estimado em cerca de 2%. Além do mais, o conjunto de dados utilizado no estudo é pequeno, do ponto de vista estatístico. Podemos acreditar que o nível de eficiência do modelo deve melhorar quanto maior for a base de dados pra treino.
Segundo, no momento atual, e ainda por muito tempo a frente, a inteligência artificial atua como auxiliar na tomada de decisão. O fator humano ainda é imprescindível.
Fica muito evidente o potencial das máquinas em fornecer diagnósticos ou, pelo menos, em fornecer os subsídios para um diagnóstico, o que deve servir como incentivo adicional para que mais pesquisas sejam realizadas, não somente para aperfeiçoar o que já foi obtido, mas também para a descoberta de novas aplicações da inteligência artificial.
Portanto, é inegável o potencial que a inteligência artificial possui para contribuir positivamente com a pesquisa científica. Sua utilização já pode ser considerado como um novo paradigma para o modo de se fazer ciência. Como sua utilização ainda encontra-se em estágios iniciais, ainda não temos previsão de estimar o quanto pode contribuir para novas descobertas. Mas, vale a reflexão por parte dos agentes envolvidos na pesquisa científica para adaptarem-se à esta nova modalidade. É de fundamental importância que nosso sistema de ensino não ignore esta tendência, ou ficaremos cada vez mais para trás na produção de conhecimentos e tecnologias.