Delomaten

Sist endret

October 5, 2025

WarningTjenesten er under utvikling

Delomaten er under utvikling og er ikke tilgjengelig for Dapla-team enda. Tjenesten vil lanseres ila høsten 2025.

Delomaten er en Dapla-tjeneste som automatiserer sikker deling av data mellom team med forskjellige datatilganger av hensyn til behov og personvern.

Den fungerer slik:

  1. Delomaten leser data og metadata fra produktbøtta til det delende teamet.
  2. Dataene blir pseudonymistert eller depseudonymisert basert på oppsettet det delende teamet har laget.
  3. Resultatet lagres i en egen Delomaten-bøtte som kun mottaker teamet har tilgang til.

Team A deler data med Team B. Gjennom Delomaten vil data automatisk bli pseudonymisert/depseudonymisert og flyttet til en Delomaten-bøtte hvor kun Team B har tilgang.

Team A deler data med Team B. Gjennom Delomaten vil data automatisk bli pseudonymisert/depseudonymisert og flyttet til en Delomaten-bøtte hvor kun Team B har tilgang.

Personvern og forutsetninger

Før du tar i bruk Delomaten, er det viktig at du setter deg inn i hvordan personvern håndteres i SSB. Delomaten er laget for å støtte trygg deling av data mellom team med ulike tilgangsnivåer og må brukes i tråd med SSBs personvernregler.

Les mer på siden Personvern i Dapla.

Sett opp Delomaten

For å sette opp Delomaten gjør følgende endringer i teamets IAC-repo:

  1. Sjekk at dataene er dokumentert
    • Alle data som deles gjennom Delomaten må være dokumentert i Datadoc.
    • Hver datafil må ha en tilhørende metadatafil (.json) som lastes opp samtidig.
    • Hvis metadatafilen mangler, vil jobben feile automatisk.
  2. Aktiver tjenesten
  3. Opprett Delomaten-bøtte
  4. Lag konfigurasjonsfil i GitHub
    • Opprett automation/shared-data/<Ditt team>-prod/<>/config.yaml.
    • Beskriv hvilke kolonner som skal pseudonymiseres/depseudonymiseres.

Konfigurasjonsfilen

Konfigurasjonsfilen (config.yaml) styrer hvordan Delomaten skal behandle dataen. Filen må ligge i teamets IAC-repo, under automation/shared-data/....

github.com/statisticsnorway/dapla-example-iac
dapla-example-iac
├── automation/
│   ├── shared-data/
│   │   ├── dapla-example-prod/
│   │   │    └── altinn
│   │   │    └── ameld
│   │   └── dapla-example-test/
│   │        └── altinn
│   │        └── ameld
│   │        └── skatt
│   └── source-data/
│       ...
│...

Viktige parametre

  • shared_bucket Navnet på Delomaten-bøtta der resultatet lagres.

  • source_folder_prefix Stien til kildedata i produktbøtta.

    • Hvis du setter source_folder_prefix: "forbruk/", betyr det at alle filer under mappen forbruk/ i produktbøtta deles.
    • Tips: Hvis du bare vil dele deler av mappen, kan du bruke underkataloger eller et mer spesifikt prefix.
  • destination_folder Navnet på mappen i Delomaten-bøtta som mottakerne får tilgang til.

    • Vanligvis setter du samme navn som source_folder_prefix, men du kan velge fritt.
  • memory_size Ressurser jobben maksimalt får tilgang til spesifisert i Gigabyte (for avanserte brukere).

  • pseudo En liste over kolonner som skal pseudonymiseres, og hvilken algoritme som skal brukes.

  • depseudo En liste over kolonner som skal depseudonymiseres. Hvilken algoritme som brukes bestemmes utfra metadataen til variabelen.

Eksempeler på pseudonymisering

automation/shared-data/mitt-dapla-team-prod/ledstill/config.yaml
shared_bucket: "delomatentest"
source_folder_prefix: "forbruk/"
destination_folder: "forbruk"
memory_size: 6
pseudo:
  - name: task_one
    columns: [ "fnr" ]
    encryption:
      algorithm: "sid_mapping"
      sid_snapshot_date: "2025-07-07"

Her pseudonymiseres kolonnen fnr med sid mapping og katalogdato 2025-07-07.

automation/shared-data/mitt-dapla-team-prod/ledstill/config.yaml
shared_bucket: "delomatentest"
source_folder_prefix: "forbruk/"
destination_folder: "forbruk"
memory_size: 6
pseudo:
  - name: task_one
    columns: [ "fnr" ]
    encryption:
      algorithm: "sid_mapping"

Her pseudonymiseres kolonnen fnr med sid mapping og siden katalogdato ikke er spesifisert brukes den nyeste.

automation/shared-data/mitt-dapla-team-prod/ledstill/config.yaml
shared_bucket: "delomatentest"
source_folder_prefix: "forbruk/"
destination_folder: "forbruk"
memory_size: 6
pseudo:
  - name: task_one
    columns: [ "fnr" ]
    encryption:
      algorithm: "sid_mapping"
  - name: task_two
    columns: [ "snr" ]
    encryption:
      algorithm: "papis_compatible"
  - name: task_three
    columns: [ "fornavn", "etternavn" ]
    encryption:
      algorithm: "default"

Her pseudonymiseres flere kolonner med forskjellige algoritmer:

  • fnr kolonnen pseudonymiseres med sid mapping og nyeste sid-katalog
  • snr kolonnen pseudonymiseres med papis algoritmen, men uten noe sid mapping
  • fornavn og etternavn kolonnene pseudonymiseres med default algoritmen som altså er DAEAD

Eksempel på depseudonymisering

automation/shared-data/mitt-dapla-team-prod/ledstill/config.yaml
shared_bucket: "delomatentest"
source_folder_prefix: "ledstill/"
destination_folder: "ledstill"
memory_size: 6
depseudo:
    columns: ["fnr", "fnr_naa"]

Her depseudonymiseres fnr og fnr_naa kolonnene med de samme algoritmene og parameterene som de ble pseudonymisert med. Denne informasjonen blir hentet fra datadoc metadataen til variablene.

Feilmeldinger

Konfigurasjonsfilen valideres automatisk når du oppretter en pull request i GitHub. Hvis noe er feil får du en tydelig feilmelding: Delomaten test feil

Eksempel på feilmelding i workflow Delomaten feilmelding