Tekniske spesifikasjoner for datasett
Våre åpne datasett leveres som nedlastbare csv
og xlsx
-filer.
CSV
Vi forsøker å levere csv-filer som er tett opp mot RFC4180.
Attributt | Spesifikasjon |
---|---|
Tegnkodeformat | UTF-8 |
Byte Order Mark (BOM) | Nei |
Linjedeler | CRLF |
Bruk av anførseltegn | Feltene inneholder generelt ikke anførselstegn, med mindre dataene i feltet inneholder anførselstegn eller skilletegn. Vi bruker dobbelt anførselstegn (“). |
Etterfølgende linje | Ja |
Filene våre leveres på norsk og engelsk og disse er i hovedsak teknisk like. Foruten ulikt språk har filene også disse forskjellene:
Attributt | Norsk | Engelsk |
---|---|---|
Skilletegn | ; (semikolon) | , (komma) |
Desimalskilletegn | , (komma) | . (punktum) |
XLSX - Excel
Filene leveres med “Standard” formatering i alle celler.
Tegnsetting følger av lokalt valgt pc-språk.
Filnavn
Filnavn er spesifisert på typen <id>-<filter>-<språk>-<år>-<måned>-<dag>.<filtype>
.
id
er et lesbart navn på datasettet som reflekterer hvilke verdier som leveres samt aggregeringsnivå.
For eksempelproduction_per_date_mba_type
, datasettet leverer produksjonsverdier aggregert på Dato, Prisområde og ProduksjonsTypefilter
er filtreringsnivå, foreløpig begrenset til å kun vise alt:all
språk
om filen skal leveres med norsk eller engelsk tegnsetting, Entenno
elleren
år
hvilket år datasettet har aggregert verdier for, dersom0000
betyr det alle tilgjengelige årmåned
hvilken måned datasettet har aggregert verdier for, dersom00
betyr det alle tilgjengelige månederdag
hvilken dag datasettet har aggregert verdier for, dersom00
betyr det alle tilgjengelige dagerfiltype
entencsv
ellerxlsx
Eksempel:
Datasett for produksjon aggregert per Dato, Prisområde og ProduksjonsType på norsk for all tilgjengelig data i csv
format vil se slik ut: production_per_date_mba_type-all-no-0000-00-00.csv
Noen ganger fjerner vi 0000 og 00 for år, måned og dag for at filnavnet skal være litt lettere å lese. For eksempelet over betyr det at filnavnet vises som production_per_date_mba_type-all-no.csv
Fil-adresse
Filene leveres fra domenet data.elhub.no. De fleste fil-lenkene vil gi en omdirigering til frzq0sxltynr.objectstorage.eu-frankfurt-1.oci.customer-oci.com. Dette er vår dedikerte kunde-endepunkt hos vår hosting-leverandør.
Adressen følger mønsteret: https://data.elhub.no/download/<datasett-id>/<filnavn>
.
Filene leveres komprimert med gzip og HTTP header Content-Encoding: gzip
uavhenging av klientens Accept-Encoding
i forespørsel. De alle fleste klienter aksepterer gzip, men for enkelte (f.eks. curl
) må dette aktiveres spesifikt eller filene må dekomprimeres etter nedlasting.