Pesquisadores e profissionais de saúde ganharam uma nova ferramenta para analisar grandes volumes de dados e conjuntos de informações sobre a área. A Plataforma de Ciência de Dados aplicada à Saúde é uma iniciativa do Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz) que disponibiliza para a comunidade científica e gestores um serviço online de armazenamento, gestão e análise de dados em saúde, possibilitando o uso de estratégicas como análise visual, mineração de dados, big data, aprendizagem de máquina, dentre outras.
“É um serviço de computação científica voltado para o setor de saúde”, explica o coordenador da plataforma, Marcel Pedroso, do Laboratório de Informação em Saúde (Lis/Icict). A partir de parcerias com o Laboratório Nacional de Computação Científica (LNCC) e a Dell EMC, o projeto utiliza conceitos de processamento distribuído, tornando a plataforma uma área de trabalho de alta capacidade para análise de dados.
A interface é dividida em três eixos: Análise visual, voltada para indexação, extração e análise visual de dados, por meio de ferramentas livres como Elasticsearch e Kibana; Mineração de Dados e Análise Preditiva, que permitirá ao pesquisador a conexão aos dados via R Studio Server; e Data Science Lab, que será uma área colaborativa para troca de experiências para inovação e aprendizagem na área de ciência de dados.
“Na prática, a plataforma permitirá aos pesquisadores uma capacidade avançada para processamento de algoritmos para análise desses grandes volumes de dados, não só da área de saúde, mas também de outras fontes como o IBGE, INPE, dentre outras, que sejam públicas e estejam disponíveis”, explica Pedroso. Além disso, os dados que já se encontram disponíveis passaram por tratamento de modelagem e indexação. No nível individual, os dados disponibilizados são anonimizados.
“A plataforma permitirá mais agilidade para a pesquisa, pois conta com um hardware bastante robusto e suporte constante”, aponta Jefferson Lima, tecnologista do Centro de Tecnologia da Informação e Comunicação (Ctic/Icict) e responsável pela governança de dados na plataforma. Sua instalação foi viabilizada por meio de parcerias e fomento do Programa de Indução à Pesquisa e Desenvolvimento Tecnológico (PIPDT/Icict) e Faperj.
Além da infraestrutura, a plataforma também tem o objetivo de ser um espaço para capacitação e especialização para a área de ciência de dados aplicada à saúde. Haverá uma equipe de referência composta por profissionais de diversas áreas, conforme a própria característica desse campo. “A Ciência de Dados é um campo de interseção entre a Estatística, a Computação e a área de interesse, no nosso caso, a saúde”, descreve o coordenador. Os membros receberão curso de capacitação com reconhecimento internacional e há previsão de abertura de um curso de especialização dessa área a ser oferecido pela Gestão Acadêmica do Icict.
A interface para a plataforma está disponível no site do projeto em bigdata.icict.fiocruz.br. Para acessar a plataforma, os interessados deverão realizar um cadastro no sistema, informando e-mail e criando uma senha de acesso. Saiba como foi o Seminário do Centro de Estudos sobre Ciência de Dados Aplicada à Saúde.
André Bezerra (Icict/Fiocruz)
Fonte: Blog Saúde