BA l Bahia
Efetivo (CLT)
Biólogo
Biomédico
Biotecnologista
Tecnologia da Informação
Responsabilidades
- Projetar pipelines reprodutíveis (pré-processamento, alinhamento, chamadas de variantes, gVCF, joint-calling) utilizando containers e seguindo melhores práticas internacionais (GATK Best Practices, nf-core).
- Estabelecer métricas de qualidade para sequências (FASTQ/BAM/VCF) e metadados clínico-fenotípicos, definindo thresholds, alertas e relatórios.
- Desenvolver rotinas automatizadas para ingestão, auditoria e curadoria, garantindo eficiência, padronização e rastreabilidade.
- Apoiar a construção de catálogos agregados de variantes (frequências populacionais), indexação e versionamento de metadados conforme ontologias reconhecidas (HPO, SNOMED-CT, OMOP, GA4GH).
- Elaborar documentos técnicos, guias e templates para garantir governança, auditoria e reprodutibilidade dos processos.
- Atuar na articulação com equipes de centros de pesquisa, laboratórios de sequenciamento e projetos financiados pelo DECIT que geram dados genômicos.
- Participar de reuniões técnicas nacionais e internacionais, produzindo apresentações, relatórios de progresso e materiais técnicos de comunicação.
- Criar e manter documentação completa e clara, garantindo que pipelines e procedimentos possam ser mantidos, auditados e evoluídos pela equipe no futuro.
Requisitos
- QUALIFICAÇÕES MÍNIMAS
- Mestrado em Bioinformática ou áreas correlatas envolvendo ciências da saúde, biologia computacional, genética, ciência de dados biomédicos ou informática aplicada à genômica humana.
- Mínimo de 5 anos em bioinformática (acadêmica ou profissional), com atuação comprovada em genômica.
- Experiência sólida no desenho, implementação, operação e otimização de pipelines reprodutíveis (pré-processamento, mapeamento, chamadas de variantes, joint-genotyping etc.).
- Participação prévia como bioinformata em projetos de genômica.
- Experiência prática com Nextflow e/ou WDL/Cromwell, incluindo execução em ambientes HPC.
- Domínio de ferramentas essenciais: GATK, BWA, samtools/bcftools, Picard.
- Uso de ontologias biomédicas (HPO, SNOMED, OMOP) ou experiência em mapeamento de metadados clínicos.
- Experiência com containers (Docker, Singularity/Apptainer).
- Vivência em QC e curadoria de dados genômicos.
- Conhecimento de ambientes HPC (SLURM, filas, quotas, logs, storage distribuído).
- Sólida experiência em Linux e Shell Script.
- Experiência com Git, versionamento, CI/CD e boas práticas de engenharia de software.
- Comunicação clara, inclusive para traduzir conceitos complexos a equipes multidisciplinares.
- Capacidade de liderança técnica e mentoria de bioinformatas mais jovens.
- Abordagem analítica e orientada à solução de problemas.
- Capacidade de trabalhar em ambiente colaborativo e de alta responsabilidade científica.
- QUALIFICAÇÕES PREFERENCIAIS
- Experiência com padrões GA4GH (htsget, refget, DUO, Phenopackets).
- Experiência no uso de ferramentas e estrutura de dados para registro de dados fenotípicos como RedCAP.
- Familiaridade com modelos de dados clínicos, especialmente OMOP-CDM.
- Inglês intermediário, especialmente para reuniões e apresentações.
- Doutorado em Bioinformática ou áreas correlatas.
- Publicações científicas relevantes em genômica ou bioinformática.
- Experiência prévia em projetos nacionais ou multicêntricos de grande escala.
- Experiência com pipelines nf-core, HAIL ou Spark genômico.
- Conhecimento de processamento em GPU e Nvidia Parabricks em genômica.
Benefícios
- Ambiente acolhedor e colaborativo.
- Profissionais altamente qualificados e multidisciplinares.
- Infraestrutura de ponta (HPC, data lake seguro, TRE).
- Incentivo à inovação, formação contínua e autonomia científica.