Ihmettelen kovin koko XML:n tarkoitusta, koska varsinaisen datan sijaan se sisältää suurimmalta osin pelkkää roskaa. Kuinka esimerkiksi saadaan helpoiten talteen lämpötilatiedot tästä linkistä: http://opendata.fmi.fi/wfs/fin?service=WFS&version=2.0.0&request=GetFeature&storedquery_id=fmi::observations::weather::timevaluepair&fmisid=101520&
Ovat siis kätketty tälläiseen, ja tuosta tarvittaisiin vain aikatieto ja arvo. Yksittäisiä arvoja on siis kymmeniä.
<wml2:point><wml2:MeasurementTVP><wml2:time>2019-04-19T00:50:00Z</wml2:time><wml2:value>3.6</wml2:value></wml2:MeasurementTVP></wml2:point>
XML sekamelskan perkaus
7
1159
Vastaukset
Suorita tämä koodi:
var wmlNs = "http://www.opengis.net/waterml/2.0";
var allPoints = document.getElementsByTagNameNS(wmlNs, "point");
var clearData = Array.from(allPoints).map( p=>{
var timeEl = p.getElementsByTagNameNS(wmlNs, "time")[0];
var time = timeEl ? timeEl.textContent : "";
var valueEl = p.getElementsByTagNameNS(wmlNs, "value")[0];
var value = valueEl ? valueEl.textContent : "";
return {time: time, value: value}
});
Nyt sinulla pitäisi olla kaikki 936 arvoa listassa clearData objekteina {time, value}.- Anonyymi
Olen nyt yrittänyt tapella Pythonin ja XPathin kanssa, mutta en ole keksinyt mitä pitäisi laittaa xpathiin. Erroria pukkaa esim. jos yrittää päästä toiseen tasoon saakka, johon pääsin kyllä jsonin kautta pyöräyttämällä myös, mutta siitä ei saanut sitten purettua enempää.
Tämä ei siis toimi:
import requests
from lxml import etree
url = "http://opendata.fmi.fi/wfs/fin?service=WFS&version=2.0.0&request=GetFeature&storedquery_id=fmi::observations::weather::timevaluepair&fmisid=101520&"
data = requests.get(url)
root = etree.XML(data.text.encode("utf-8"))
results = root.xpath("/wfs:FeatureCollection/wfs:member")
Tästä yritin saada apuja: https://lxml.de/xpathxslt.html
Taidan tehdä niin että otan stringinä käsittelyyn ja puran manuaalisesti. On tuo XML kyllä ihme sekamelskaa. - Anonyymi
Anonyymi kirjoitti:
Olen nyt yrittänyt tapella Pythonin ja XPathin kanssa, mutta en ole keksinyt mitä pitäisi laittaa xpathiin. Erroria pukkaa esim. jos yrittää päästä toiseen tasoon saakka, johon pääsin kyllä jsonin kautta pyöräyttämällä myös, mutta siitä ei saanut sitten purettua enempää.
Tämä ei siis toimi:
import requests
from lxml import etree
url = "http://opendata.fmi.fi/wfs/fin?service=WFS&version=2.0.0&request=GetFeature&storedquery_id=fmi::observations::weather::timevaluepair&fmisid=101520&"
data = requests.get(url)
root = etree.XML(data.text.encode("utf-8"))
results = root.xpath("/wfs:FeatureCollection/wfs:member")
Tästä yritin saada apuja: https://lxml.de/xpathxslt.html
Taidan tehdä niin että otan stringinä käsittelyyn ja puran manuaalisesti. On tuo XML kyllä ihme sekamelskaa.TÄSSÄ PYTHON3 MALLIA
Korvaa ??? tiedoston osoitteella.
from xml.dom import minidom
import urllib.request
url = 'http://???'
urllib.request.urlretrieve(url, "data.xml")
mydoc = minidom.parse('data.xml')
items = mydoc.getElementsByTagName('wml2:time')
i=0
for x in items:
print(str(i) ": " items[i].lastChild.data)
i=i 1
Testaa tämä. - Anonyymi
Anonyymi kirjoitti:
TÄSSÄ PYTHON3 MALLIA
Korvaa ??? tiedoston osoitteella.
from xml.dom import minidom
import urllib.request
url = 'http://???'
urllib.request.urlretrieve(url, "data.xml")
mydoc = minidom.parse('data.xml')
items = mydoc.getElementsByTagName('wml2:time')
i=0
for x in items:
print(str(i) ": " items[i].lastChild.data)
i=i 1
Testaa tämä.Tuo on ihan lupaava lähtökohta, koska tulostaa kaikki ajat kuten pitääkin. Pitäisi vielä se mittausarvo ympätä tuohon.
- Anonyymi
Anonyymi kirjoitti:
Tuo on ihan lupaava lähtökohta, koska tulostaa kaikki ajat kuten pitääkin. Pitäisi vielä se mittausarvo ympätä tuohon.
Arvot mukaan vaikka näin:
from xml.dom import minidom
import urllib.request
url = ???'
urllib.request.urlretrieve(url, "data.xml")
mydoc = minidom.parse('data.xml')
times = mydoc.getElementsByTagName('wml2:time')
values = mydoc.getElementsByTagName('wml2:value')
i=0
for x in times:
print(str(i) ": " times[i].lastChild.data \
" " values[i].lastChild.data)
i=i 1 - Anonyymi
Anonyymi kirjoitti:
Arvot mukaan vaikka näin:
from xml.dom import minidom
import urllib.request
url = ???'
urllib.request.urlretrieve(url, "data.xml")
mydoc = minidom.parse('data.xml')
times = mydoc.getElementsByTagName('wml2:time')
values = mydoc.getElementsByTagName('wml2:value')
i=0
for x in times:
print(str(i) ": " times[i].lastChild.data \
" " values[i].lastChild.data)
i=i 1Kiitokset! Nyt ymmärsin tuon logiikan. Hämäsi hieman tuo käyttämäsi for-lauseke.
Ketjusta on poistettu 1 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
- 1006424
Nikkalassa vauhdilla nokka kohti taivasta
Mitähän Darwin sanoisi näistä 4 suomalaisesta, jotka kävivät Haparandan puolella näyttämässä, kuinka Suomi auto kulkee t303843törniöläiset kaaharit haaparannassa
isäpapan autolla kaahatta 270 km/h metsään https://www.lapinkansa.fi/nsd-kaksi-suomalaista-kuoli-kolarissa-haaparannall/283220Sitä saa mitä tilaa Perussuomalaiset!
https://yle.fi/a/74-20160212 SDP:n kannatus se vain nousee ja Keskusta on kolmantena. Kokoomus saanut pienen osan persu3701736- 331398
- 271340
Eelin, 20, itsemurhakirje - Suomalaisen terveydenhuollon virhe maksoi nuoren elämän
Yksikin mielenterveysongelmien takia menetetty nuori on liikaa. Masennusta sairastava Eeli Syrjälä, 20, ehti asua ensi46989Anteeksi kulta
En oo jaksanut pahemmin kirjoitella, kun oo ollut tosi väsynyt. Mut ikävä on mieletön ja haluisin kuiskata korvaasi, hyv11966Perttu Sirviö laukoo täydestä tuutista - Farmi Suomi -kisaajista kovaa tekstiä "Pari mätää munaa..."
Ohhoh, Farmilla tunteet alkaa käydä kuumana, kun julkkiksia tippuu jaksosta toiseen! Varo sisältöpaljastuksia: https:11890- 42879