Este repositório descreve os quatro testes realizados para a avaliação técnica. Cada teste envolve uma etapa fundamental para o processamento, transformação e análise de dados relacionados às operadoras de planos de saúde.
Automatizar a extração de arquivos PDF a partir do site da ANS (Agência Nacional de Saúde Suplementar), compactando-os em um único arquivo.
- Extração automatizada dos links dos anexos.
- Download dos arquivos no formato PDF.
- Os PDFs foram agrupados em um único arquivo ZIP/RAR para organização e otimização do armazenamento.
- Linguagem: Python
- Bibliotecas: requests, BeautifulSoup, os, zipfile
Extrair dados tabulares do Anexo I baixado no Teste 1, estruturá-los e salvá-los em um arquivo CSV para posterior análise.
- Conversão de todas as páginas do PDF em texto estruturado.
- Identificação e extração correta das colunas e linhas da tabela.
- Conversão dos dados extraídos para o formato tabular.
- Salvamento em um arquivo .csv para facilitar a análise posterior.
- O arquivo CSV gerado foi compactado como "Teste_Vinicius.zip" para reduzir o tamanho e facilitar o compartilhamento.
- As colunas OD e AMB foram substituídas pelos seus nomes completos conforme a legenda no rodapé do PDF.
- Linguagem: Python
- Bibliotecas: PyMuPDF, pandas, zipfile
Baixar, estruturar e analisar dados financeiros das operadoras de planos de saúde utilizando um banco de dados SQL.
- Demonstrações contábeis dos últimos 2 anos: https://dadosabertos.ans.gov.br/FTP/PDA/demonstracoes_contabeis/
- Dados cadastrais das operadoras ativas: https://dadosabertos.ans.gov.br/FTP/PDA/operadoras_de_plano_de_saude_ativas/
- Definição da estrutura das tabelas para armazenar os dados extraídos dos arquivos CSV.
- Inserção dos registros no banco de dados, garantindo a correta codificação dos caracteres.
- Consulta 1: Identificação das 10 operadoras com maiores despesas em "Eventos/Sinistros Conhecidos ou Avisados de Assistência à Saúde Médico-Hospitalar" no último trimestre.
- Consulta 2: Identificação das 10 operadoras com maiores despesas nessa mesma categoria no último ano.
- Banco de Dados: PostgreSQL 10+
- Linguagem: SQL
- Ferramenta: pgAdmin
Criar uma interface web utilizando Vue.js para buscar operadoras de saúde em um servidor Python, retornando os dados relevantes via API.
- Utilização do CSV baixado no Teste 3 para alimentar a API.
- Implementação de um servidor backend em Python para fornecer um endpoint de busca textual na base de operadoras.
- Implementação de um formulário no Vue.js para permitir buscas interativas.
- Exibição dos resultados em tempo real.
- Criação de uma coleção no Postman para demonstrar o funcionamento da API e validar os retornos dos endpoints.
- Backend: FastAPI (Python)
- Frontend: Vue.js
- Ferramenta: Postman, Axios