Skip to main content

Tekniske spesifikasjoner for datasett

Våre åpne datasett leveres som nedlastbare csv og xlsx-filer.

CSV

Vi forsøker å levere csv-filer som er tett opp mot RFC4180.

Attributt

Spesifikasjon

Tegnkodeformat

UTF-8

Byte Order Mark (BOM)

Nei

Linjedeler

CRLF

Bruk av anførseltegn

Feltene inneholder generelt ikke anførselstegn, med mindre dataene i feltet inneholder anførselstegn eller skilletegn.

Vi bruker dobbelt anførselstegn (“).

Etterfølgende linje

Ja

Filene våre leveres på norsk og engelsk og disse er i hovedsak teknisk like. Foruten ulikt språk har filene også disse forskjellene:

Attributt

Norsk

Engelsk

Skilletegn

; (semikolon)

, (komma)

Desimalskilletegn

, (komma)

. (punktum)

XLSX - Excel

Filene leveres med “Standard” formatering i alle celler.

Tegnsetting følger av lokalt valgt pc-språk.

Filnavn

Filnavn er spesifisert på typen <id>-<filter>-<språk>-<år>-<måned>-<dag>.<filtype>.

  • ider et lesbart navn på datasettet som reflekterer hvilke verdier som leveres samt aggregeringsnivå.
    For eksempel production_per_date_mba_type, datasettet leverer produksjonsverdier aggregert på Dato, Prisområde og ProduksjonsType

  • filter er filtreringsnivå, foreløpig begrenset til å kun vise alt: all

  • språk om filen skal leveres med norsk eller engelsk tegnsetting, Enten no eller en

  • år hvilket år datasettet har aggregert verdier for, dersom 0000 betyr det alle tilgjengelige år

  • måned hvilken måned datasettet har aggregert verdier for, dersom 00 betyr det alle tilgjengelige måneder

  • dag hvilken dag datasettet har aggregert verdier for, dersom 00 betyr det alle tilgjengelige dager

  • filtype enten csv eller xlsx

Eksempel:
Datasett for produksjon aggregert per Dato, Prisområde og ProduksjonsType på norsk for all tilgjengelig data i csv format vil se slik ut: production_per_date_mba_type-all-no-0000-00-00.csv

Noen ganger fjerner vi 0000 og 00 for år, måned og dag for at filnavnet skal være litt lettere å lese. For eksempelet over betyr det at filnavnet vises som production_per_date_mba_type-all-no.csv

Fil-adresse

Filene leveres fra domenet data.elhub.no. De fleste fil-lenkene vil gi en omdirigering til frzq0sxltynr.objectstorage.eu-frankfurt-1.oci.customer-oci.com. Dette er vår dedikerte kunde-endepunkt hos vår hosting-leverandør.

Adressen følger mønsteret: https://data.elhub.no/download/<datasett-id>/<filnavn>.

Filene leveres komprimert med gzip og HTTP header Content-Encoding: gzip uavhenging av klientens Accept-Encoding i forespørsel. De alle fleste klienter aksepterer gzip, men for enkelte (f.eks. curl) må dette aktiveres spesifikt eller filene må dekomprimeres etter nedlasting.

Tidssoner og tidsstempel

Alle tidsstempler i våre datasettet er oppgitt i lokal norsk tid (tidssone: Europe/Oslo) og følger ISO 8601-formatet. Dette innebærer at tidsstemplene inkluderer en UTC-offset som reflekterer gjeldende norsk tid, det vil si +01:00 om vinteren (normaltid) og +02:00 om sommeren (sommertid).

Eksempel: 2021-01-01T01:00:00+01:00

Unntak

Excelfilene, dvs. der filnavnet slutter på .xlsx, er UTC-offset ikke inkludert, da excel ikke støtter dette. For disse filene er tidsformatet “YYYY-MM-DD hh:mm:ss“.

Eksempel: 2021-05-10 06:00:00

JavaScript errors detected

Please note, these errors can depend on your browser setup.

If this problem persists, please contact our support.