Väestötietojärjestelmän tietoja tarjolla avoimena datana

Väestötietopalvelut - 04.09.2017

Vuoden 2017 alusta alkaen Väestörekisterikeskus on kehittänyt ja ylläpitänyt avoindata.fi-palvelua. Väestörekisterikeskuksen väestötietojärjestelmästä palveluun on julkaistu kourallinen tietoja, suosituimpien joukossa nimiaineistot sekä rakennusten osoite- ja koordinaattitiedot. Avoin data ei koskaan sisällä henkilötietoja, kolmansien tahojen tekijänoikeuksia tai lain mukaan salassa pidettäviä tietoja.

Avoindata.fi-sivustolla julkaistut Väestötietojärjestelmän suomalaisten nimiaineistot ovat koko palvelun suosituin aineisto. Aineisto julkaistiin ensimmäisen kerran 14.10.2014. Nimien lukumäärätiedot päivitetään kahdesti vuodessa julkaisemalla uusi aineisto. Kolmen julkaisuvuoden aikana nimiaineistoilla on ollut sivunäyttöjä 74 117 ja latauksia kaikkiaan 19 890.

Avoimena datana julkaistavissa tiedoissa on erona jo pitkään käytössä olleeseen Nimipalveluun (http://verkkopalvelu.vrk.fi/nimipalvelu) se, että nimien lukumäärät julkaistaan erikseen ensimmäisten etunimien ja kaikkien etunimien osalta. Nimipalvelussa ei tätä erotusta ole tehty, vaan julkaistut lukumäärät ovat henkilön kaikkien etunimien yleisyyden mukaan. Kaikista miesten nimistä kolme yleisintä Juhani, Olavi ja Antero ovat ensimmäisinä niminä vasta sijoilla 84, 106 ja 241. Yleisimmissä naisten nimissä Maria, Helena ja Anneli sijoitukset ensimmäisinä niminä ovat 31, 53 ja 125. Lisäksi avoindata.fi-aineistosta pääsee suoraan tarkastelemaan listausta 5 178 miehen ja 6 762 naisen nimistä niiden yleisyysjärjestyksessä, kun Nimipalvelussa on kerrottu vain 10 yleisintä nimeä vuosikymmenittäin.

Nimipalvelua sekä nimiaineistoja avoimena datana käytetään ahkerasti, kun lapselle mietitään nimiä. Ennen kuin Nimipalvelu otettiin käyttöön 2000-luvun alussa, tuli Väestörekisterikeskukseen runsaasti tiedusteluja puhelimitse eri nimien lukumääristä.

Avoindata.fi-palvelun palautteessa on toivottu myös etunimiluetteloita syntymävuoden ja kotikunnan mukaan. Vaikka tämä voisi olla mukava lisäys, tulisi luettelosta merkittävästi isompi: jokaisen ikäluokan osalta pitäisi tehdä listaus kunnittain, eli 311 kuntaa x miesten nimet + naisten nimet = 622 tilastoa. Kun näistä erotetaan vielä ensimmäiset etunimet ja kaikki etunimet, kertautuu määrä kahdella. Syntymävuosien mukaan saataisiin sata ikäluokkaa, jolloin tarvittaisiin yli 124 000 eri tilastoa.

Myös rakennustiedot avoimena datana

Koko Suomen rakennusten osoite- ja koordinaattitiedot julkaistiin ensimmäisen kerran reilu vuosi sitten 22.4.2016. Päivitetty aineisto julkaistaan neljännesvuosittain. Tiedoissa julkaistaan koko maan kaikkien 3,5 miljoonan rakennuksen koordinaattitiedot ja rakennusten osoitteet, joten kyse on merkittävän suuresta aineistosta. Rakennustiedoilla on tähän mennessä ollut sivunäyttöjä kaikkiaan 4 225 ja latauksia yhteensä 1 712.

Rakennustietoja on käytetty muun muassa joukkoliikennepalvelujen kehittämiseen ja navigointikarttojen osoiteaineistoina sekä niiden tarkkuuden parantamiseen. Tietoja voidaan käyttää myös esimerkiksi jakelureittien suunnitteluun jakelu- tai postitoiminnassa.

Kaupungeissa ja keskusta-alueilla osoitenumerointi on yleensä aika suoraviivaista rakennusten osoitteiden ollessa numerojärjestyksessä parilliset toisella puolen katua ja parittomat vastakkaisella puolella. Maaseudulla ja harvaan asutuilla alueilla on usein käytössä osoitenumerointi, joka kertoo rakennuksen sijainnin tietystä risteyksestä tai muusta pisteestä laskettuna. Tällainen osoitenumerointi on hankala siirtää karttapohjalle täsmällisenä sijaintina, koska se edellyttää etäisyyden laskemista suhteessa toiseen pisteeseen. Kun tiedossa ovat rakennuksen tarkat sijaintikoordinaatit ja rakennukseen kiinnitetty osoite, voidaan osoite sijoittaa tarkasti oikeaan kohtaan kartalle ja navigaattori neuvoo täsmällisesti perille myös maaseudulla.

Rakennustietojen julkaisusta on saatu käyttäjiltä positiivista palautetta, ja lisäksi ilmoituksia virheistä rakennusten tiedoissa. Tyypillisiä virheitä ovat rakennusten virheelliset sijaintikoordinaatit sekä pienemmät virheet esim. rakennuksen osoitteen kirjoitusasussa. Tästä palautteesta on hyötyä Väestörekisterikeskukselle, kun tiedon käyttäjät auttavat parantamaan rakennus- ja osoitetietojen laatua. Havaitut virheet ohjataan virheellisten koordinaattien tai osoitteen korjauksen osalta kuntiin tarkistettaviksi. Korjauksen jälkeen oikea tieto tulee myös väestötietojärjestelmään, josta se välitetään edelleen muille viranomaisille. Avoindata.fi-palveluun muutokset päivittyvät seuraavan julkaisun yhteydessä. Käyttäjiltä on myös saatu jo toiveita tietojen tiheämmästä julkaisuvälistä ja tietosisällön laajentamisesta.

Rakennustietoja on aikaisemminkin luovutettu lukuisille eri viranomaisille ja muille käyttäjätahoille. Tietojen julkaisulla avoimena datana haluttiin kuitenkin tarjota rakennusten osoitteet ja sijaintikoordinaatit helpommin kaikkien eri käyttäjätahojen saataville yhteiskunnan toimintaa tehostamaan.

  • Avoindata.fi -palvelu julkaistiin 2014 osana Valtiovarainministeriön avoimen tiedon ohjelmaa.
  • Vuodesta 2017 eteenpäin palvelua kehittää ja ylläpitää Väestörekisterikeskus.
  • Palvelun tavoite on toimia Suomen keskitettynä avoimen datan jakelualustana, josta data siirtyy Euroopan unionin avoimen datan portaaliin. Myös yrityksen voivat julkaista palvelussa avointa dataa ja metatietoja.
  • Palvelu pyrkii edistämään julkishallinnon läpinäkyvyyttä, avoimen julkisen datan löydettävyyttä ja saatavuutta sekä mahdollistamaan avoimen datan vaivaton hyödyntäminen ja käyttöönotto erilaisissa sovelluksissa.
  • Palvelu tukee sähköisten palvelujen kehittämistä ohjeiden ja suositusten avulla. Lisäksi se julkaisee tietoaineistoja, jotka tukevat liiketoimintaa, toiminnan kehitystä, koulutusta ja tutkimusta.
  • Avoin data ei koskaan sisällä henkilötietoja, kolmansien tahojen tekijänoikeuksia tai lain mukaan salassa pidettäviä tietoja.
  • Väestörekisterikeskus avoindata.fi-palvelussa: https://www.avoindata.fi/data/fi/organization/vaestorekisterikeskus

Lähde: avoindata.fi