CA | ES | EN
News Details

Enginyer/a Sènior de Dades
Enginyer/a Sènior de Dades

26/MAY/2026
26/MAY/2026

 

L'Institut de Recerca en Intel·ligència Artificial (IIIA) del CSIC busca un/una ENGINYER/A SÈNIOR DE DADES per incorporar-se a la Unitat de Desenvolupament Tecnològic dins del projecte Plataforma Horizontal d’IA i Serveis OneHealth. Treball remot des de l’IIIA-CSIC amb validacions i desplegaments a la infraestructura de càlcul del CESGA.

Descripció del projecte

La Plataforma OneHealth té per objectiu proporcionar un entorn comú i reproducible per desenvolupar, executar i escalar solucions d’IA per equips de recerca del CSIC, integrant ingestió de dades, pipelines d’entrenament i inferència i orquestració sobre recursos HPC del CESGA.

Responsabilitats principals

  • Dissenyar l’arquitectura de dades de la plataforma: ingestió, emmagatzematge, catalogació i APIs d’accés segures seguint principis FAIR.
  • Construir pipelines reproducibles d’ingestió i preprocés per a dades heterogènies (imatges, sèries temporals, dades espacials, grafs, text).
  • Implementar versionat de conjunts de dades, lineage, control de qualitat i metadades.
  • Integrar mecanismes d’anonimització/pseudonimització i solucions per a dades sensibles; suport a generació de dades sintètiques i augmentació.
  • Col·laborar amb l’equip d’IA/MLOps per adaptar dades a fluxos d’entrenament i inferència.
  • Desenvolupar i mantenir catàlegs/metadades.
  • Documentar processos, guies d’ús i polítiques de governança; participar en validacions amb pilots científics.

L'Institut de Recerca en Intel·ligència Artificial (IIIA) del CSIC busca un/una ENGINYER/A SÈNIOR DE DADES per incorporar-se a la Unitat de Desenvolupament Tecnològic dins del projecte Plataforma Horizontal d’IA i Serveis OneHealth. Treball remot des de l’IIIA-CSIC amb validacions i desplegaments a la infraestructura de càlcul del CESGA.

Descripció del projecte

La Plataforma OneHealth té per objectiu proporcionar un entorn comú i reproducible per desenvolupar, executar i escalar solucions d’IA per equips de recerca del CSIC, integrant ingestió de dades, pipelines d’entrenament i inferència i orquestració sobre recursos HPC del CESGA.

Responsabilitats principals

  • Dissenyar l’arquitectura de dades de la plataforma: ingestió, emmagatzematge, catalogació i APIs d’accés segures seguint principis FAIR.
  • Construir pipelines reproducibles d’ingestió i preprocés per a dades heterogènies (imatges, sèries temporals, dades espacials, grafs, text).
  • Implementar versionat de conjunts de dades, lineage, control de qualitat i metadades.
  • Integrar mecanismes d’anonimització/pseudonimització i solucions per a dades sensibles; suport a generació de dades sintètiques i augmentació.
  • Col·laborar amb l’equip d’IA/MLOps per adaptar dades a fluxos d’entrenament i inferència.
  • Desenvolupar i mantenir catàlegs/metadades.
  • Documentar processos, guies d’ús i polítiques de governança; participar en validacions amb pilots científics.

Requisits:

Requisits imprescindibles

  • Titulació en Informàtica, Enginyeria, Ciència de Dades o similar.
  • Experiència pràctica amb contenidors Docker i integració amb entorns HPC (Slurm o similar).
  • Anglès tècnic fluid; castellà i/o català desitjables.

Valorable

  • Experiència amb ETL/ELT, orquestradors (Airflow/Prefect), object storage i sistemes de fitxers distribuïts.
  • Coneixement de formats científics (NetCDF, HDF5) i tractament amb Python (pandas, xarray, dask).
  • Experiència amb versionat de dades (DVC/Delta Lake/alternatives) i catalogació de metadades.
  • Coneixements en dades espacials (PostGIS), grafs i processament geoespacial.
  • Experiència prèvia en generació de dades sintètiques per domini científic.

Requisits imprescindibles

  • Titulació en Informàtica, Enginyeria, Ciència de Dades o similar.
  • Experiència pràctica amb contenidors Docker i integració amb entorns HPC (Slurm o similar).
  • Anglès tècnic fluid; castellà i/o català desitjables.

Valorable

  • Experiència amb ETL/ELT, orquestradors (Airflow/Prefect), object storage i sistemes de fitxers distribuïts.
  • Coneixement de formats científics (NetCDF, HDF5) i tractament amb Python (pandas, xarray, dask).
  • Experiència amb versionat de dades (DVC/Delta Lake/alternatives) i catalogació de metadades.
  • Coneixements en dades espacials (PostGIS), grafs i processament geoespacial.
  • Experiència prèvia en generació de dades sintètiques per domini científic.

Salary: 

33.941,46 € bruts anuals
33.941,46 € bruts anuals

Duration: 

contracte indefinit - vinculació al projecte amb previsió de durada del projecte: 36 mesos.
contracte indefinit - vinculació al projecte amb previsió de durada del projecte: 36 mesos.

Workday: 

37,5 hores setmanals
37,5 hores setmanals

Workplace: 

IIIA-CSIC, Campus UAB, Bellaterra (Cerdanyola del Vallès) amb possibilitat de dies de teletreball
IIIA-CSIC, Campus UAB, Bellaterra (Cerdanyola del Vallès) amb possibilitat de dies de teletreball

Start date: 

Tan aviat com sigui possible
Tan aviat com sigui possible

Closing date: 

26/JUN/2026
26/JUN/2026


Els candidats hauran d'enviar el seu currículum en format pdf per correu electrònic, amb l'assumpte "oferta de feina OneHealth Dades" a Joan Jené (jjene@iiia.csic.es).

Els candidats hauran d'enviar el seu currículum en format pdf per correu electrònic, amb l'assumpte "oferta de feina OneHealth Dades" a Joan Jené (jjene@iiia.csic.es).


Per a més informació, poseu-vos en contacte amb Joan Jené (jjene@iiia.csic.es).

Per a més informació, poseu-vos en contacte amb Joan Jené (jjene@iiia.csic.es).