Muut työkalut

IRC kanava:
#avoindata

Mistä saa osoitteiden koordinaatit?

4 tykkää 0 ei tykkää
  • henri
  • Points : 490
  • Ranked : 13
  • Badges : 1 2 5
490
kysytty 2. syyskuuta, 2013 kategoriassa Datatoive | henri (490 pistettä) toimesta

Julkisen liikenteen reittiopas- ja navigaatiopalvelut voivat ohjata käyttäjänsä vain niihin osoitteisiin, joista on saatavilla karttakoordinaatit. Samat tiedot tarvitaan monenmoisiin karttasovelluksiin.

Helsingin osoiteluettelo on jo Helsinki Region Infosharessa (HRI) julkaistu, mutta tällaista geokoodausdataa ei koko Suomen kattavasti ole vielä avoimena ja viranomaislähteestä saatavilla. Maanmittauslaitos (MML) ei tietääkseni tarjoa karttapalvelujensa osoitteista avointa APIa tai raakadatalatausta. Lisäksi MML:n karttapalveluiden osoitteet ovat puutteellisia ja laskennallisia, eivät kattavia ja yksitellen mitattuja.

Sen sijaan Väestörekisterikeskus (VRK) kerää kaikilta Suomen kunnilta tiedot osoitteiden koordinaateista. VRK on mielestäni oikea taho avaamaan tarvittavaa dataa. Täsmennän vielä, ettei ole tarkoitus pyytää tietoja siitä, missä kukakin asuu. Kyse on vain rakennusten tiedoista, joten tietosuojan ei pitäisi olla esteenä.

Kiinnostavaa dataa on vaikea speksata käymättä vuoropuhelua VRK:n kanssa. Tarkoitukseni on tässä tuoda selväksi, että rakenteellista osoitedataa kaivataan kipeästi, vaikka datassa olisi aukkoja. Jos jonkun voi kuvitella käyttävän jotakin VRK:n tietoa paikanhakuun, se informaatio olisi kiva saada tähän avaukseen.

Ehdotan, että data avattaisiin usein päivittyvänä CSV:nä, joka sisältäisi esimerkiksi kentät:

  • pysyvä rakennustunnus (VTJ-PRT, muoto on "1" + 8 numeroa + aakkosnumeerinen tarkistemerkki)
  • rakennustunnus (koostuu kuudesta erillisestä kentästä)
    • kuntanumero
    • sijaintialuenumero
    • ryhmänumero
    • yksikkönumero
    • tarkistemerkki
    • rakennusnumero
  • osoitenimi (Ei lyhenteitä. Kenttien määrä riippuu VRK:n datasta.)
    • suomeksi
    • ruotsiksi
    • pohjoissaameksi
    • karjalaksi
    • romaniksi
    • jne.
  • osoitenumero
  • osoitenumeron kauttaviivan jälkeinen numero (tontilla voi olla useita rakennuksia, jolloin kauttaviiva erottaa tontin ja rakennuksen numerot)
  • osoitenumeron kirjain (kiinteistö voi olla jaettu)
  • toinen osoitenumero (kiinteistö voi olla yhdistetty)
  • toisen osoitenumeron kauttaviivan jälkeinen numero
  • toisen osoitenumeron kirjain
  • huoneiston kirjainosa (käytännössä rappukirjain)
  • huoneiston numero-osa (ilman jakeluosoitteen "as."- tai "bst."-lyhenteitä)
  • huoneiston jakokirjain (esiintyy esimerkiksi soluasunnoissa)
  • kerroksen numero (hyödyllistä informaatiota esimerkiksi niille, jotka eivät näe lukea kerrostalojen huoneistotauluja)
  • postinumero
  • postinumeron tekstiosa (esimerkiksi isoilla organisaatioilla voi olla omansa)
  • postitoimipaikka
  • koordinaatit (Kenttien määrä riippuu käytetyistä koordinaattijärjestelmistä. Kukin järjestelmä pysyköön omissa kentissään, ja nimenomaan alkuperäinen raakadata tulee avata. Raakadataa löytynee ainakin ETRS-TM35FIN, KKJ- ja ETRS-GKn-koordinaatistoissa. Kahdesta jälkimmäisestä täytyy ymmärtääkseni antaa koordinaattien lisäksi käytetty kaista tai keskimeridiaani. Järkevää olisi antaa koordinaatistojen EPSG-koodit, kunhan ne menevät oikein.)
    • latitudi EUREF-FIN-koordinaatistossa täydellä tunnetulla tarkkuudella
    • longitudi EUREF-FIN-koordinaatistossa täydellä tunnetulla tarkkuudella
    • korkeus merenpinnasta metreinä täydellä tunnetulla tarkkuudella
    • muut koordinaattijärjestelmät

CSV:n soisi olevan UTF-8-koodattu ja RFC 4180:n mukainen sillä pedantilla tarkennuksella, ettei tyhjää tilaa sallita kenttien reunoille pilkkujen ja lainausmerkkien väliin silloinkaan, kun kentän data suljetaan lainausmerkkien sisään.

Tästä väärintehty esimerkki:
..., "Sikosaari, Kesamonsaari",...
Ja oikein:
...,"Sikosaari, Kesamonsaari",...

Patologinen (ja vajaa) esimerkki Mielikuvituskatu 15/6-17a E 39b voitaisiin kirjata näin:
,,,,,,Mielikuvituskatu,Fantasigatan,,,,15,6,,17,,a,E,39,b,00250,,Helsinki,60.18562757114746,24.916584491729736,10.2

Voi olla tarpeen muodostaa erilliset kentät lähi-, jakelu- ja postiosoitteen palasille, ja täyttää jälkimmäiset vain, jos ne poikkeaisivat ensimmäisistä. Vastaavasti jos joidenkin rakennusten koordinaatteja ei tunneta, ja ne on numeroitu etäisyyteen perustuvalla osoitenumerointijärjestelmällä, voisi käytetylle osoitenumerointijärjestelmälle olla oma kenttänsä.

Erikseen pitäisi kertoa, miten rakennustunnus puretaan selkokielisiksi palasiksi, kuten kunnan suomen- ja ruotsinkieliseksi nimeksi. Ilmeisesti VRK:n Kunta- ja rekisterinpitäjäluettelo kertoo ainakin kuntanumeron ja kunnan nimien yhteyden. En ole varma, onko kyseinen luettelo jo jossakin virallisena, avoimena ja koneluettavana niin, että se sisältäisi myös vanhat kunnat. Ainakin Wikipediassa on kattavanoloinen lista myös vanhoista kunnista.

Asuntoja on VRK:lla lähes kolme miljoonaa, joten tiedoston voi arvioida jäävän pakkaamattomana puoleen gibitavuun (140 merkkiä rivillä * 1.2 mutu-utf-8-kerroin * 3e6 riviä / 2^30 ≈ 0.47). Pakatusta tiedostosta tuskin tulisi valtava eikä sitä tarvinne jakaa pienempiin osiin.

Kunhan OpenStreetMap-yhteisö saa MML-datan lisenssikuviot selviksi, kannattaa noudattaa esimerkkiä ja lisensoida data samoin OpenStreetMapin kanssa yhteensopivaksi.

Olen valmis viemään asiaa eteenpäin Helsingin seudun liikenteen puolelta, mutta toivon ideoita, vetoapua ja kokemusta HRI:ltä ja muilta kiinnostuneilta. Kiitos.

Referenssejä:
Osoitteiden rakenne: JHS 106
Lisää osoitteista: Suomen Kuntaliitto - Kunnan osoitejärjestelmä 2006
Rakennustunnus: JHS 104
Kiinteistötunnus (sisältyy rakennustunnukseen): JHS 138
Kuntien numerotunnus (sisältyy kiinteistötunnukseen): JHS 110
Huoneiston tunniste: JHS 109

EDIT: Lisäsin speksiin pysyvän rakennustunnuksen ja tarkensin koordinaattispeksiä.

muokattu 23. syyskuuta, 2013 henri toimesta
Sivulla http://avoindata.net/171/mista-saa-osoitteiden-koordinaatit
On rikkinäinen linkki kohdassa

Sen sijaan Väestörekisterikeskus (VRK) kerää kaikilta Suomen kunnilta tiedot <<osoitteiden koordinaateista>>.

http://vrk.fi/default.aspx?id=175

5 Vastausta

0 tykkää 0 ei tykkää
  • jreini
  • Points : 230
  • Ranked : 24
  • Badges : 1 1 3
230
vastattu 10. syyskuuta, 2013 | jreini (230 pistettä) toimesta

Akuuttiin tarpeeseen osoitteiden koordinaatteja saa Maanmittauslaitoksen rajapintapalvelusta.

Ao. osoitteesta voi hakea puolen vuoden maksutonta koekäyttöä. Samalla voi ottaa käyttöön myös uuden WMTS-karttakuvapalvelun.

http://www.maanmittauslaitos.fi/lomakkeet/hakemus-rajapintapalvelun-koekaytosta

Esim. Haetaan se Osoitenimi kunnan Helsinki alueelta, jonka katunimi on Opastinsilta ja katunumero 12.

Xml-rakenteinen pyyntö:

<?xml version="1.0" encoding="UTF-8"?>
<wfs:GetFeature version="1.1.0"
xmlns:oso="http://xml.nls.fi/Osoitteet/Osoitepiste/2011/02"
xmlns:wfs="http://www.opengis.net/wfs"
xmlns:gml="http://www.opengis.net/gml"
xmlns:ogc="http://www.opengis.net/ogc"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.opengis.net/wfs
http://schemas.opengis.net/wfs/1.1.0/wfs.xsd">
 <wfs:Query typeName="oso:Osoitenimi">
  <ogc:Filter>
                       <ogc:And>
                               <ogc:PropertyIsEqualTo>
                                       <ogc:PropertyName>oso:kuntanimiFin</ogc:PropertyName>
                                      <ogc:Literal>Helsinki</ogc:Literal>
                               </ogc:PropertyIsEqualTo>
                               <ogc:PropertyIsEqualTo>
                                      <ogc:PropertyName>oso:katunimi</ogc:PropertyName>
                                      <ogc:Literal>Opastinsilta</ogc:Literal>
                               </ogc:PropertyIsEqualTo>
                               <ogc:PropertyIsEqualTo>
                                      <ogc:PropertyName>oso:katunumero</ogc:PropertyName>
                                      <ogc:Literal>12</ogc:Literal>
                               </ogc:PropertyIsEqualTo>
                       </ogc:And>
               </ogc:Filter>

 </wfs:Query>
</wfs:GetFeature>

 

Esim. Vastaus

 

Kiitos vastauksesta ja esimerkistä! Tuo voi todella sopia jonkun akuutteihin tarpeisiin. Mainittakoon kuitenkin eksplisiittisesti, ettei tuossa palvelussa ole kyse avoimesta datasta vaan hetken ilmaisesta rajapinnasta. Jos osoitedata olisi avointa, voisimme lopulta valita vapaasti valmiista geokoodausratkaisuista: https://github.com/HSLdevcom/hsl-navigator/wiki/Prototype-design#geocoder Jotkut niistä tarjoavat esimerkiksi sumean osoitehaun, maailmanlaajuisesti.
3 tykkää 0 ei tykkää
  • Pekka Sarkola
  • Points : 720
  • Ranked : 9
  • Badges : 2
  • paikkatieto.com
  • Location : Espoo
720
vastattu 13. syyskuuta, 2013 | posiki (720 pistettä) toimesta

Varma huhu: VRK saattaa avata tietoaineistojaan ensi vuonna.

Kiireisille kehittäjille on kaksi ratkaisua:

  • Käytä OpenStreetMap:in Nominatim-palvelua: http://wiki.openstreetmap.org/wiki/Nominatim. Jos käyttö on suurta, niin sitten on syytä toteuttaa oma palvelu
  • Lataa MML:n tiestö osoittella ja muodostat siitä osoitepisteistön: karkea ratkaisu, koska osoitteet eivät osu talojen kohdalle. Riittää n. 10 metrin paikannukseen kaupungeissa ja 50+ m haja-asutusalueilla. Voisin tietysti tuon pisteistön laittaa jonnekin ladattavaksi, jos joku on oikeasti kiinnostunut.

P

Lisäys Nominatimista: MapQuest Open tarjoaa Nominatim-rajapintansa (ilmeisesti vanhempi Nominatim v1, ei anna täysin samanlaisia tuloksia kuin OSM:n oma palvelu) ilman käyttömäärärajoituksia. Esim. HSL-navigaattorissa yhdistelemme pääkaupunkiseudun osoiterekisterin ja MapQuest Open Nominatimin tuloksia.

Ja joo, olemme kyllä oikeasti kiinnostuneita MML:n epätarkemmastakin osoitepisteistöstä, esim. Tampereen navigaattori kaipaa sellaista kovasti.
Maastotietokannan osoitteiden haltuunottoa on kuvattu ohjeessa:
http://latuviitta.org/documents/Maastotietokannan_osoitteiden_haltuunotto.pdf
Osoitteet ovat ladattavissa valmiiksi irrotettuina kahdessa eri tiedostomuodossa
http://latuviitta.org/documents/mtk_osoitteet_2012.zip ja http://latuviitta.org/documents/mtk_osoitteet_2012_shapefile.zip
Lisäksi Helsingin kaupungin osoitteet saa paitsi HRI:n kautta niin myös WFS-palvelusta, aineisto nro 115 hakemistosivulla http://latuviitta.org/documents/hip.latuviitta.org.html
Hieno juttu. Kiitos. Jos VRK:n avaus kaipaa lisää avustajia tai käyttäjien näkemyksiä, tiedätkö, keihin meidän kannattaa ottaa yhteyttä? Yksityisviestejäkin voi näemmä täällä lähettää.
En tiedä VRK:n yhteyshenkilöitä. Ehkä voisi katsoa Hankerekisteristä heidän edustajansa avoimen data lisenssi -työryhmässä.

Oliko tämä yksityisviesti?

P
Mainio idea. En löytänyt VRK:n väkeä tulevan JHS-lisenssisuosituksen työryhmästä, mutta muita sopivia hankkeita löytyi. Yksityisviestejä voi lähettää ainakin kunkin käyttäjän profiilisivulta.
0 tykkää 0 ei tykkää
  • henri
  • Points : 490
  • Ranked : 13
  • Badges : 1 2 5
490
vastattu 23. syyskuuta, 2013 | henri (490 pistettä) toimesta

Posikin vihjeen perusteella löytyi 2012-03-23 julkaistu asiakirja, jossa Väestörekisterikeskus selostaa mieluusti avaavansa dataa. Kuitenkin lainsäädäntö, henkilöresurssit ja tekninen ympäristö rajoittavat. Nostan olennaisimmat kohdat esiin:

"VTJ:n [Väestötietojärjestelmän] rakennustietojen osalta on esitetty, että niiden ei pitäisi nauttia samaa henkilötietojen suojaa kuin VTJ:n henkilötiedot ja ne voitaisiin erottaa vapaammin käytettäväksi tietovarannoksi. Toistaiseksi tulkinta on kuitenkin ollut tiukka. VRK kannattaa ajatusta, että selvitetään myös mahdollisuudet lainsäädännön muuttamiseksi tai vähintään käydään läpi lain tulkinta ja käytänteet näiltä osin."

"Virastoille ehdotettujen toimenpiteiden lista on kannatettava ja VRK on osaan toimenpiteistä jo ryhtynytkin, joskin rajalliset henkilöresurssit sekä teknisen ympäristön asettamat haasteet tulevat pitkittämään työn ajallisesti kestämään jopa 2020-luvulle asti."

Pelottavalta kuulostava aikajänne koskee VTJ:tä kokonaisuudessaan, ei pelkästään rakennusdataa. Valoa saattaa kuitenkin näkyä

"-- RaKi-hankkeessa, jossa pääpaino on VTJ:n rakennustietojen käsittelyn ja sisällön uudistamisessa, pyrkimyksenä ainakin jossain määrin erottaa rakennustiedot henkilötietosidonnaisuudesta".

RaKi-hankkeen joistakin seminaarikalvoista voi lukea, että kukin rakennus saa pysyvän rakennustunnuksen (VTJ-PRT), jota on tarkoitus käyttää rakennuksen yksiselitteiseen tunnistamiseen.

Hannu Kojon teksti Positio-lehden numerossa 2/2012 paljastaa, että kuntien ja VRK:n rakennuskannoissa on melkoisia eroavaisuuksia, joita kuntanumerosta riippumattoman PRT:n on kuvitellakseni tarkoitus vähentää. Kojo kertoo myös, kuinka

"VRK on aikoinaan tallentanut sellaisia väestölaskentojen yhteydessä kansalaisilta kerättyjä tietoja kuin kerrosala ilman mitään takeita tietojen oikeellisuudesta tai edes keskinäisestä yhteismitallisuudesta".

Seminaarimateriaaleista ilmenee, ettei VRK aio enää jatkossa panostaa esimerkiksi huoneistojen pinta-alatietoihin.

VRK tulee suosimaan ETRS-TM35FIN-koordinaatteja, mutta hyväksyy siirtymävaiheessa myös KKJ- ja ETRS-GKn-koordinaatteja. Ainakin näitä muotoja voi siis olettaa tietokannasta löytyvän. Pitää vielä tarkentaa, minkälaisista KKJ- tai ETRS-GKn-koordinaateista on kyse.

En vielä löytänyt, onko lainsäädännöllinen ongelma jo poistunut. Muokkaan kysymyksen speksin vastaamaan näitä uusia tietoja.

1 tykkäys 0 ei tykkää
  • Tuukka Hastrup
  • Points : 1640
  • Ranked : 3
  • Badges : 2 3
  • http://dev.hsl.fi/
  • Location : Helsinki
  • Code for Europe -kumppanikoodari Helsingin seudun liikenteellä HSL:llä
1.64K
vastattu 17. lokakuuta, 2013 | tuukka (1,640 pistettä) toimesta

Koko Suomen kattava avoin osoitteiden hakurajapinta:

Yhteenveto avoimista osoiteaineistoista:

Tulossa (laki ehkä keväällä 2014, data ehkä keväällä 2015):

  • VRK:n rakennustietojen osoiteluettelo (VRK:n tarkka aineisto)

VRK:llakaan ei ole koordinaatteja kuin rakennuksen tarkkuudella, eli rappukohtaista tietoa on vain OpenStreetMapissa.

Vertailun vuoksi, muissa maissa osoitedatat on jo avattu:

muokattu 27. lokakuuta, 2014 tuukka toimesta
4 tykkää 0 ei tykkää
  • Ranked : 25977
vastattu 13. marraskuuta, 2013 | Marko Kauppi toimesta
Tampereen kaupungin kiinteistöjen sekä haja-asutusalueen rakennusten osoitteet ovat nyt saatavilla kaupungin WMS- ja WFS -palvelusta.

http://palvelut2.tampere.fi/tietovaranto/tietovaranto.php?id=88&alasivu=1&vapaasana=
Hieno juttu, kiitos! En vielä syventynyt, mitä kaikki kentät tarkoittavat, mutta olennaisin tavara löytyy.
Sisällön lisenssi:

Datatoiveet

Aiemmat datatoiveet:

Esitä datatoive!

Tietoja

Avoindata.net on pystytetty suomalaisen avoimen datan verkoston avoimeksi tukisivustoksi. Suomalaisten tietovarantojen kieli on monesti suomi. Käytä siis suomen kieltä.


Kategoriat ovat työn alla, joten jos kaipaat jotain kategoriaa, lähetä palautetta.

201 kysymystä

235 vastausta

165 kommenttia

25,976 käyttäjää

Suosituimmat tagit

Sponsorit

...