Tekniske spesifikasjoner for datasett
Våre åpne datasett leveres som nedlastbare csv og xlsx-filer.
CSV
Vi forsøker å levere csv-filer som er tett opp mot RFC4180.
Attributt | Spesifikasjon |
|---|---|
Tegnkodeformat | UTF-8 |
Byte Order Mark (BOM) | Nei |
Linjedeler | CRLF |
Bruk av anførseltegn | Feltene inneholder generelt ikke anførselstegn, med mindre dataene i feltet inneholder anførselstegn eller skilletegn. Vi bruker dobbelt anførselstegn (“). |
Etterfølgende linje | Ja |
Filene våre leveres på norsk og engelsk og disse er i hovedsak teknisk like. Foruten ulikt språk har filene også disse forskjellene:
Attributt | Norsk | Engelsk |
|---|---|---|
Skilletegn | ; (semikolon) | , (komma) |
Desimalskilletegn | , (komma) | . (punktum) |
XLSX - Excel
Filene leveres med “Standard” formatering i alle celler.
Tegnsetting følger av lokalt valgt pc-språk.
Filnavn
Filnavn er spesifisert på typen <id>-<filter>-<språk>-<år>-<måned>-<dag>.<filtype>.
ider et lesbart navn på datasettet som reflekterer hvilke verdier som leveres samt aggregeringsnivå.
For eksempelproduction_per_date_mba_type, datasettet leverer produksjonsverdier aggregert på Dato, Prisområde og ProduksjonsTypefilterer filtreringsnivå, foreløpig begrenset til å kun vise alt:allspråkom filen skal leveres med norsk eller engelsk tegnsetting, Entennoellerenårhvilket år datasettet har aggregert verdier for, dersom0000betyr det alle tilgjengelige årmånedhvilken måned datasettet har aggregert verdier for, dersom00betyr det alle tilgjengelige månederdaghvilken dag datasettet har aggregert verdier for, dersom00betyr det alle tilgjengelige dagerfiltypeentencsvellerxlsx
Eksempel:
Datasett for produksjon aggregert per Dato, Prisområde og ProduksjonsType på norsk for all tilgjengelig data i csv format vil se slik ut: production_per_date_mba_type-all-no-0000-00-00.csv
Noen ganger fjerner vi 0000 og 00 for år, måned og dag for at filnavnet skal være litt lettere å lese. For eksempelet over betyr det at filnavnet vises som production_per_date_mba_type-all-no.csv
Fil-adresse
Filene leveres fra domenet data.elhub.no. De fleste fil-lenkene vil gi en omdirigering til frzq0sxltynr.objectstorage.eu-frankfurt-1.oci.customer-oci.com. Dette er vår dedikerte kunde-endepunkt hos vår hosting-leverandør.
Adressen følger mønsteret: https://data.elhub.no/download/<datasett-id>/<filnavn>.
Filene leveres komprimert med gzip og HTTP header Content-Encoding: gzip uavhenging av klientens Accept-Encoding i forespørsel. De alle fleste klienter aksepterer gzip, men for enkelte (f.eks. curl) må dette aktiveres spesifikt eller filene må dekomprimeres etter nedlasting.