Fontes de Big Data em Medicina

by Kevin Hwang, MD, MPH; Avaliado por Richard N. Fogoros, MD

Uma definição simples de big data na medicina é “a totalidade dos dados relacionados à assistência médica e ao bem-estar do paciente” (Raghupathi 2014). Mas o que exatamente são esses tipos de dados e de onde eles vêm?

A seguir, é apresentada uma visão geral dos tipos e fontes de big data de interesse para os prestadores de serviços de saúde, pesquisadores, pagadores, formuladores de políticas e indústria.

Essas categorias não são mutuamente exclusivas, porque os mesmos dados podem se originar de uma variedade de fontes.

Essa lista também não é exaustiva, porque a aplicação prática da análise de big data certamente continuará a se expandir.

Sistemas de Informação Clínica

Estas são fontes tradicionais de dados clínicos que os profissionais de saúde estão acostumados a ver.

Os registros eletrônicos de saúde (EHRs) coletam, armazenam e exibem informações como dados demográficos, histórico médico, problemas médicos ativos, imunizações, alergias, medicamentos, sinais vitais, resultados de exames laboratoriais e radiológicos, relatórios de patologia, notas de progresso criadas pelos serviços de saúde fornecedores e documentos administrativos e financeiros
Os registros médicos eletrônicos (EMRs) não são idênticos aos EHRs e geralmente se referem a dados armazenados com um médico específico.
Os intercâmbios de informações sobre saúde servem como pontos centrais entre diferentes sistemas de informação clínica

Registros de pacientes, mantidos por organizações de assistência médica em seus próprios pacientes, estão frequentemente ligados ao EHR. Outros registros rastreiam imunizações, câncer, trauma e outros problemas de saúde pública em uma escala geográfica mais ampla.

Portais de pacientes permitem que os pacientes acessem informações pessoais de saúde armazenadas no EHR de uma organização de saúde. Alguns portais de pacientes também permitem que os usuários solicitem recargas de prescrição e troquem mensagens eletrônicas seguras com a equipe de atendimento médico.

Armazéns de dados clínicos agregam dados em nível de pacientes de vários sistemas de informações clínicas, como EHRs e outras fontes listadas acima

Dados de reclamações de pagadores

Os pagadores públicos (por exemplo, Medicare) e os pagadores privados têm grandes repositórios de dados de sinistros sobre seus beneficiários. Algumas seguradoras de saúde agora também oferecem incentivos para compartilhar seus dados de saúde.

Estudos de pesquisa

Bancos de dados de pesquisa contêm informações sobre os participantes do estudo, tratamentos experimentais e resultados clínicos. Grandes estudos geralmente são patrocinados por empresas farmacêuticas ou agências governamentais. Uma aplicação de medicina personalizada é combinar pacientes individuais com tratamentos eficazes, com base em padrões de dados de ensaios clínicos.

Essa abordagem vai além da aplicação de princípios de medicina baseados em evidências, pelos quais um profissional de saúde determina se um paciente compartilha características amplas (por exemplo, idade, sexo, raça, estado clínico) com os participantes do estudo. Com a análise de big data, é possível selecionar um tratamento baseado em informações muito mais granulares, como o perfil genético do câncer de um paciente (veja abaixo).

Sistemas de apoio à decisão clínica (CDSS) também têm se desenvolvido rapidamente e agora representam uma grande parte da inteligência artificial (IA) na medicina.

Eles usam os dados do paciente para auxiliar os médicos na tomada de decisões e são frequentemente combinados com os EHRs.

Bancos de dados genéticos

O repositório de informações genéticas humanas continua a se acumular em um ritmo acelerado. Desde que o Projeto Genoma Humano foi concluído em 2003, o custo do sequenciamento de DNA humano foi reduzido em um milhão de vezes. O Projeto Genoma Pessoal (PGP), lançado em 2005 pela Harvard Medical School, busca sequenciar e divulgar os genomas completos de 100.000 voluntários de todo o mundo. O próprio PGP é um excelente exemplo de projeto de big data devido ao grande volume e variedade de dados.

Um genoma pessoal contém cerca de 100 gigabytes de dados. Além de sequenciar os genomas, o PGP também coleta dados de EHRs, pesquisas e perfis de microbiomas.

Várias empresas oferecem sequenciamento genético direto ao consumidor para a saúde, características pessoais e farmacogenética em bases comerciais.

Essas informações pessoais podem ser subjugadas para análise de big data. Por exemplo, a 23andMe parou de oferecer relatórios genéticos relacionados à saúde para novos clientes a partir de 22 de novembro de 2013, em conformidade com a Food and Drug Administration dos EUA. No entanto, em 2015, a empresa começou a oferecer certos componentes de saúde de seu teste de saliva genética novamente, desta vez com a aprovação da FDA.

Dados públicos

O governo mantém registros detalhados de eventos relacionados à saúde, como imigração, casamento, nascimento e morte. O Censo dos EUA coletou grandes quantidades de informações a cada 10 anos desde 1790. O site de estatísticas do Censo tinha 370 bilhões de células em 2013, com aproximadamente 11 bilhões a mais de valor anual.

Pesquisas na Web

As informações de pesquisa na Web coletadas pelo Google e outros provedores de pesquisa da Web podem fornecer insights em tempo real relacionados à saúde de uma população. No entanto, o valor de big data dos padrões de pesquisa da Web pode ser melhorado combinando-o com fontes tradicionais de dados de integridade.

Mídia social

Facebook, Twitter e outras plataformas de mídia social geram uma rica variedade de dados o tempo todo, dando uma visão sobre os locais, comportamentos de saúde, emoções e interações sociais dos usuários. A aplicação de grandes mídias sociais à saúde pública tem sido referida como detecção digital de doenças ou epidemiologia digital. O Twitter, por exemplo, tem sido usado para analisar epidemias de gripe entre a população em geral.

O Projeto Bem-Estar Mundial, iniciado na Universidade da Pensilvânia, é outro exemplo de estudo das mídias sociais para entender melhor a experiência e a saúde das pessoas. O projeto reúne psicólogos, estatísticos e cientistas da computação que analisam a linguagem usada ao interagir on-line, por exemplo, ao escrever atualizações de status no Facebook e no Twitter. Os cientistas estão observando como a linguagem dos usuários se relaciona com sua saúde e felicidade. Avanços no processamento de linguagem natural e aprendizado de máquina estão ajudando em seus esforços. Uma publicação recente da Universidade da Pensilvânia examinou formas de prever doenças mentais através da análise das mídias sociais. Parece que os sintomas de depressão e outras condições de saúde mental podem ser detectados pelo estudo do uso da Internet. Os cientistas esperam que, no futuro, esses métodos sejam capazes de identificar e ajudar melhor os indivíduos em risco.

A Internet das Coisas (IoT)

Massivos trunfos de informações relacionadas à saúde também são coletados e armazenados em dispositivos móveis e domésticos .

Smartphones : milhares de aplicações mHealth captam informações sobre a atividade física, ingestão nutricional, padrões de sono, emoções e outros parâmetros do usuário. Aplicativos nativos de telefone celular (por exemplo, GPS, e-mail, mensagens de texto) também podem fornecer pistas sobre o status de saúde de um indivíduo.
Monitores e dispositivos vestíveis: pedômetros, acelerômetros, óculos, relógios e chips embutidos sob a pele também reúnem informações relacionadas à saúde e também podem enviá-las para a nuvem.
Os dispositivos de telemedicina permitem que os profissionais de saúde monitorem os parâmetros dos pacientes, como pressão arterial, freqüência cardíaca, frequência respiratória, oxigenação, temperatura, traçados de ECG e peso.

Transações Financeiras

As transações com cartão de crédito dos pacientes são incluídas nos modelos preditivos usados pelo Sistema Carolinas HealthCare para identificar pacientes que correm alto risco de serem readmitidos no hospital. O prestador de cuidados de saúde baseado em Charlotte usa dados grandes para dividir os pacientes em vários grupos, por exemplo, com base na doença e localização geográfica.

Implicações éticas e de privacidade

É necessário destacar que, em alguns casos, pode haver implicações éticas e de privacidade importantes ao coletar e acessar dados nos serviços de saúde. Novas fontes de big data podem melhorar nossa compreensão sobre o que impacta a saúde de indivíduos e populações, no entanto, diferentes riscos precisam ser cuidadosamente considerados e monitorados. Agora também foi reconhecido que os dados anteriormente considerados anônimos podem ser re-identificados. Por exemplo, o professor Latanya Sweeney, do Laboratório de Privacidade de Dados de Harvard, revisou 1.130 voluntários envolvidos no Projeto Genoma Pessoal. Ela e sua equipe puderam nomear corretamente 42% dos participantes com base nas informações que compartilharam (CEP, data de nascimento, sexo). Esse conhecimento pode aumentar nossa consciência dos riscos potenciais e nos ajudar a tomar melhores decisões de compartilhamento de dados.

> Fontes:

> Conway M, O'Connor D. Mídias sociais, big data e saúde mental: avanços atuais e implicações éticas. Opinião atual em Psicologia 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Grandes dados, maiores resultados. Jornal da Associação Americana de Gestão de Informação em Saúde 2012; 83 (10): 38-43

> Guntuku S, Yaden D, M Kern, Ungar L, Eichstaedt J. Detecção de depressão e doença mental nas mídias sociais: uma revisão integrativa . Opinião atual em Ciências do Comportamento 2017; 18: 43-49.

> Lazer D, Kennedy R, Rei G, Vespignani A. A Parábola do Google Flu: Armadilhas na Análise de Big Data . Ciência 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Análise de big data na saúde: promissora e potente. Ciência e Sistemas de Informação em Saúde 2014; 2: 3

> Sweeney L, Abu A, Winn J. Identificando os participantes do projeto Genoma Pessoal por nome . Universidade de Harvard. Laboratório de Privacidade de Dados. White Paper 1021-1. 24 de abril de 2013.