Para muitos, a próxima fronteira da inovação virá do Big Data. Mas a visão está longe de ser unanimidade. A hiperconectividade facilitou o acesso a um universo de informação e seu compartilhamento, mas não dá para ignorar que questões centrais continuam a desafiar a nova era da informação.
O escândalo envolvendo a Cambridge Analytica e o vazamento de dados do Facebook para a campanha eleitoral de Donald Trump deixou evidente que em torno do Big Data sobram problemas de privacidade e questões de vigilância. ”O episódio marcou um ponto de inflexão na confiança do público em relação ao Big Data”, analisou editorial do Lancet Oncology. “A comunidade de ciência da saúde deve usar essa crise de confiança para redobrar seu compromisso de falar abertamente sobre riscos e benefícios do Big Data, de forma transparente”, alertou (A roadmap for restoring trust in Big Data) 1.
E não é só a segurança dos dados que está em debate, mas sua própria consistência. Apesar do entusiasmo, não são poucos os que argumentam que a análise de grandes conjuntos de dados incompletos, fragmentados e de diferentes fontes pode resultar em lacunas e interpretações imprecisas do Big Data. Para os críticos, corremos o risco de produzir apenas big noise exatamente quando a ciência assiste à ocorrência de diferentes tipos de viés em publicações de alto impacto e desconfia de estudos que não têm demonstrado reprodutibilidade. É uma combinação que sem dúvida põe em xeque o valor do dado científico e convida a refletir sobre os riscos do Big Data, para além de suas implicações éticas.
Em agosto de 2017, a Food and Drug Administration dos EUA (FDA) emitiu orientações para o uso da chamada Real-World Evidence (RWE) para apoiar a regulamentação de devices2. Na prática, significa que a agência norte-americana passa a considerar como válidas fontes tão variadas como relatos de caso, estudos observacionais e pragmáticos, até reclamações administrativas de serviços de assistência médica ou dados obtidos na rotina da vigilância sanitária. Tudo isso passa a valer no contexto das decisões do FDA para apoiar a análise e aprovação de devices, os dispositivos médicos.
O esforço para definir um arcabouço regulatório começou bem antes. Em dezembro de 2016, o 21st Century Cures Act3 foi assinado, exigindo por força de lei que o FDA desenvolva orientações específicas para o uso de RWE para apoiar a avaliação e aprovação de novos medicamentos. No mesmo mês, Robert Califf, então comissário da FDA, publicou artigo na NEJM em defesa de métodos para fortalecer a validade e confiabilidade de estudos usando fontes de RWE. No artigo, ele descreve o compromisso da agência com o "robusto desenvolvimento de políticas e base de dados para estudos em saúde humana”4.
E aqui, como estamos? “Estamos dando os primeiros passos de uma maratona. Precisamos aguardar, fazer mais pesquisas antes de colocar em prática, discutir sobre a qualidade desses algoritmos. Os modelos de inteligência artificial e toda essa machine learning ainda estão aprendendo a tomar decisões. São algoritmos que precisam de muitos dados e dados de qualidade”, sustenta Alexandre Dias Porto Chiavegatto Filho, coordenador do Laboratório de Big Data e Análise Preditiva da Universidade de São Paulo (USP).
A Agência Nacional de Vigilância Sanitária começa a explorar as primeiras aplicações na saúde. “Esse é um campo extremamente promissor e as agências regulatórias estão iniciando seus processos no mundo inteiro”, diz o diretor-presidente da Anvisa, Jarbas Barbosa. “No Brasil, iniciamos uma cooperação com a Fiocruz Bahia, que montou um centro de Big Data voltado para a Saúde”, explica.
A cooperação com a Fiocruz utiliza os dados do CADÚnico, um cadastro de 120 milhões de pessoas inscritas nos programas sociais do governo, e começa a explorar também o universo das redes sociais. “Temos trabalhado nessa proposta de usar grandes bancos de dados estruturados e não-estruturados, como é o caso das mídias sociais, avaliando seu potencial para alertas de farmacovigilância”, diz Barbosa.
Na prática, significa explorar redes como twitter e facebook, que produzem os chamados ‘dados interacionais’. “Para a saúde, é uma fonte adicional de informação. Não é uma panaceia que vai substituir os bancos de dados tradicionais, mas é uma informação adicional, que podemos cruzar com os dados tradicionais para construir informação para a tomada de decisão”, define Marcel Pedroso, coordenador da Plataforma de Ciência de Dados aplicada à Saúde do Instituto de Comunicação e Informação Científica e Tecnológica em Saúde da Fundação Oswaldo Cruz (ICICT/FiOCRUZ).”Para a mineração de dados e análise preditiva, o usuário se conecta com o software de análise de dados dos nossos servidores e pode visualizar e extrair informações, tanto para a tomada de decisão, como para conectar algoritmos de análise de dados a partir da nossa plataforma e aí incorporar isso em modelos de decisão”, explica.
Parece complexo - e na verdade é, porque esbarra em intrincadas redes de bits e bytes e em lógicas da Tecnologia da Informação (TI), coisa indecifrável para a maior parte das pessoas.
Para os defensores do Big Data em saúde, é essa nova lógica que permite abrigar um universo que passa tanto pelo prontuário eletrônico dos pacientes como pode integrar a chamada internet das coisas (internet of things), conceito que designa a crescente conectividade da rede mundial de computadores, agora presente em dispositivos tão variados, de eletrodomésticos a peças de vestuários.
Etiquetas inteligentes de identificação por radiofrequência foram a primeira aplicação da internet das coisas. Além de permitir a localização, a tecnologia também é capaz de monitorar indicadores, como temperatura ou frequência cardíaca, por exemplo. É com esse conceito que uma série de equipamentos médicos está em desenvolvimento e outros tantos já ganharam aplicação prática. Esses pequenos dispositivos podem armazenar dados de milhares de pacientes e fica fácil entender por que a internet das coisas ganha importância no contexto do Big Data.
“O uso de Big Data na área da saúde trará importantes ganhos em termos de dinheiro, tempo e vidas e precisa ser ativamente defendido por cientistas de dados e epidemiologistas”, diz Chiavegatto Filho, da USP. Em artigo5 que discute a implementação do Big Data em saúde, ele reconhece o desafio representado pelo compartilhamento e armazenamento de grandes volumes de informação. Afinal, como assegurar transparência e confidencialidade para que iniciativas de Big Data possam realmente orientar intervenções terapêuticas inovadora e potencializar o uso de dados de saúde em favor da ciência?
Algumas iniciativas inspiradoras apontam caminhos. É o caso do Health Data Research UK, que está desenvolvendo expertise e infraestrutura de pesquisa nacional a partir de dados do National Health Service. O exemplo britânico não está sozinho. Encontro realizado em Bruxelas em abril deste ano marcou um dos mais emblemáticos acordos da era do Big Data, oficializando a criação da MEGA (Million European Genomes Alliance), uma aliança respaldada pelos Ministros da Saúde europeus e que vai reunir bancos de dados genômicos atuais ou futuros, em toda a União Europeia.
No Brasil, o olhar sobre grandes conjuntos de dados já é uma realidade na saúde.Em São Paulo, a inteligência artificial começa a ser empregada na predição de óbitos, em uma amostra longitudinal de 502.632 indivíduos, acompanhados de 2006 a 2010. No baseline, foram coletadas características socioeconômicas, demográficas, fatores de risco, informações sobre histórico de saúde, medidas antropométricas e amostras de sangue e de urina, totalizando mais de 600 variáveis. “Serão testadas as performances de 17 modelos de machine learning para predizer óbito em 1, 2 e 5 anos. O projeto permitirá identificar se é possível predizer com boa acurácia quem irá a óbito e por qual causa”, define o estudo, uma parceria entre o Laboratório de Big Data e Análise Preditiva da Faculdade de Saúde Pública da USP e a Plataforma de Ciência de Dados Aplicada à Saúde da Fiocruz Rio de Janeiro.
É só o começo, dizem os especialistas. “Temos um longo caminho pela frente, ainda falta regulamentação, mas existe um campo enorme para a tomada de decisão orientada por dados”, prevê Marcel Pedroso, do ICICT/Fiocruz. Agora é esperar e conferir os resultados.
Experiência do MD Anderson põe em xeque solução da IBM
Em 2012, o M.D Anderson Cancer Center, da Universidade do Texas, fez uma parceria com a IBM para desenvolver o difundido IBM Watson, um programa de inteligência artificial que se anunciava como ferramenta estratégica de apoio à decisão clínica na oncologia. Artigo publicado no JNCI6 em 2017 fez um balanço do acordo, informando que “cinco anos e 62 milhões de dólares depois, o M. D. Anderson encerrou seu contrato com a IBM sem que o Watson tenha tido qualquer utilização prática em pacientes reais”.
Os problemas da parceria MD Anderson-Watson provavelmente têm muito a dizer sobre a indústria de Big Data, em episódio que deixa lições importantes. Auditoria feita pela própria universidade acabaria expondo uma ampla lista de problemas com a IBM, incluindo atrasos e custos excessivos. “Embora a auditoria não tenha se posicionado sobre a base científica do Watson ou suas capacidades funcionais, ela descreveu os desafios de assimilar o Watson ao ambiente hospitalar”, escreveu Charlie Schmidt, no artigo do JNCI. Ele explica que especialistas nos aplicativos Watson apontaram dificuldades do sistema em digerir relatos de casos, anotações médicas e outras informações geradas no ambiente de assistência.
A experiência do MD Anderson está nos dizendo que é preciso ter cautela e mostra que a qualidade do dado faz toda a diferença. Reportagem veiculada no prestigiado Wall Street Journal descreve o cenário atual. “A Big Blue prometeu que sua plataforma de IA seria um grande passo adiante no tratamento do câncer. Mas depois de investir bilhões no projeto, o resultado decepciona. Mais de uma dúzia de parceiros e clientes da IBM interromperam ou reduziram projetos do Watson relacionados à oncologia. As aplicações do Watson tiveram impacto limitado nos pacientes, como reportam dezenas de entrevistas com centros médicos, empresas e especialistas, bem como documentos revisados pelo The Wall Street Journal. Nenhuma pesquisa publicada mostra o Watson melhorando os resultados dos pacientes”. 7
Inteligência artificial no diagnóstico de melanoma
O câncer de pele é reconhecidamente o mais comum em humanos e o diagnóstico começa com uma triagem clínica inicial, seguida potencialmente de análise dermatoscópica, biópsia e exame histopatológico. Agora, modelos neurais podem ajudar a classificar as lesões cutâneas a partir de imagens clínicas. É o que mostra estudo de Esteva, A et al publicado na Nature8.
Os pesquisadores utilizaram dados de 129.450 imagens clínicas para ‘ensinar’ um modelo neural, com informações relativas a 2.032 doenças diferentes. “Testamos seu desempenho contra 21 dermatologistas certificados em biópsias utilizando dois casos críticos que permitem a classificação binária: carcinomas de queratinócitos versus queratoses seborreicas benignas; e melanomas malignos versus nevos benignos. O primeiro caso representa a identificação dos cânceres mais comuns, o segundo representa o câncer de pele mais letal”, descrevem os autores.
Os resultados mostraram que a rede neural alcançou desempenho comparável ao dos dermatologistas, demonstrando uma inteligência artificial capaz de classificar o câncer de pele com um nível de acurácia profissional. “Equipados com redes neurais, os dispositivos móveis podem ampliar potencialmente o alcance de dermatologistas fora da clínica”, defendem os autores, ilustrando o papel de smartphones em diagnósticos mediados por redes inteligentes. “Estima-se 6,3 bilhões de assinaturas de smartphones até o ano 2021 com potencial de fornecer acesso universal de baixo custo a cuidados vitais de diagnóstico”, diz o estudo.
Referências:
1 - Lawler,M et al. A roadmap for restoring trust in Big Data. The Lancet Oncology (vol 19, issue 8, p 1014-1015, August 01,2018).DOI: 10.1016/S1470-2045(18)30425-X
2 - Use of Real-World Evidence to Support Regulatory Decision-Making for Medical Devices 1 Guidance for Industry and Food and Drug Administration Staff, FDA, August,2017 (Disponível em https://www.fda.gov/downloads/medicaldevices/deviceregulationandguidance/guidancedocuments/ucm513027.pdf)
3 - https://www.fda.gov/regulatoryinformation/lawsenforcedbyfda/significantamendmentstothefdcact/21stcenturycuresact/default.htm
4 - N Engl J Med. 2016 Dec 8;375(23):2293-2297 - Sherman RE, Anderson SA, Dal Pan GJ, et al. Real‐world evidence - what is it and what can it tell us? N Engl J Med. 2016;375(23): 2293‐2297
5 - CHIAVEGATTO FILHO, Alexandre Dias Porto. Uso de big data em saúde no Brasil: perspectivas para um futuro próximo. Epidemiol. Serv. Saúde [online]. 2015, vol.24, n.2, pp.325-332. ISSN 1679-4974. http://dx.doi.org/10.5123/S1679-49742015000200015.
6 - Charlie Schmidt; M. D. Anderson Breaks With IBM Watson, Raising Questions About Artificial Intelligence in Oncology, JNCI: Journal of the National Cancer Institute, Volume 109, Issue 5, 1 May 2017, djx113, https://doi.org/10.1093/jnci/djx113
7 - IBM Has a Watson Dilemma, disponível em https://www.wsj.com/articles/ibm-bet-billions-that-watson-could-improve-cancer-treatment-it-hasnt-worked-1533961147
8 - Esteva, A. et al. Nature 542, 115–118 (2017)