Team digital bevaring
I juni 2022 ble det etablert et eget team med ansvar for bevaring av Nasjonalbibliotekets digitale samling. Teamet håndterer alle typer digitalt materiale, uavhengig om materialet er digitaiisert fra analoge kilder eller om det er født digitalt. Dette inkluderer medietyper som websider, tekstdokumenter, bilder, lyd og levende bilder.
Teamets ansvarsområder har å gjøre med inntak, kontroll, lagring, bevaring av data tilgjengeliggjøring av bevarte data.
Teamets ansvarsområder omfatter innlesning, kontroll, lagring, forvaltning av materiale i Nasjonalbibliotekets løsning for langtidsbevaring. De langtidsbevarte filene er typisk store filer av høy kvalitet (i motsetning til lavoppløselige eller komprimerte tilgangsfiler). Vi samarbeider tett med flere andre spesialiserte medieteam i biblioteket som produserer data gjennom digitalisering eller mottak fra eksterne avleverere. I tillegg er vi medlemmer av Digital Preservation Coalition (DPC).
Organisasjon
Team digital bevaring består i dag av 8 medlemmer:
Teamet svarer til en eiergruppe bestående av:
- Direktør for IT (produkteier)
- Direktor for Kulturarvdigitalisering
- Seksjonsleder for Tilvekst og kunnskapsorganisering utvikling
- Seksjonsleder for IT-plattform
Nasjonalbibliotekets digitale samling i tall
- Over 2 milliarder filer
- Mer enn 90 forskjellige filformater
- 15 Petabyte med data (det er 15 000 Terabyte!) lagret i 3 kopier
- Den største enkeltfilen er på 2,5 Terabyte
- Gjennomsnittlig daglig tilvekst av over 4 Terabyte nye data
Datavolum etter type
- Video og TV: 22 prosent
- Film: 21 prosent
- Aviser 19%
- Webarkiv: 16%
- Radio og lyd 12%
- Bøker 8%
- Bilder 2%
Teknologi som brukes i arbeidet med digital bevaring
- Apache Kafka for kommunikasjon mellom systemer
- Apache NiFi for å kjøre prosesser som validerer, flytter og pakker data
- MariaDB som databasemotor
- DROID for identifisering av filformater
- Grafana for statistikk og rapportering
- IBM High Performance Storage System (HPSS) som bit-repository
- GlusterFS for delt midlertidig lagring
- CentOS Linux som serverplattform