Tiedon parsiminen toiselta sivulta

simusimu

Moi,

Miten olisi helpoin tapa parsia pätkä tietoa toiselta sivulta?

Minun täytyisi saada sivun datasta osa näytettyä tuo "25 item number" omalla sivulla. Data on tämän näköinen:


25 item number

noita sub3 kohtia on useampiakin mutta tuo mitä tarvitsen on sivun ensimmäinen.
Eli miten "löydän" tuon kohdan sorsasta, kiitoksia :)

8

999

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • simusimu

      Tähän lisäyksenä että onko joku muu kuin PHP parempi tähän tehtävään?

    • teuro

      Jos tiedät, että kyseinen div-elementti on varmasti ensimmäinen "sub3"-elementti. Voit aika vapaasti käyttää $divit = getElementsByTagName("div"); funktiota, jolla saat jokaisen div-elemntin käyttöön. Ensimmäinen elementti on $divit -> item(0); ja sen tekstitieto on $divit -> item(0) -> textContent;

      Mutta sinähän et halunnut ekaa diviä, vaan ensimmäisen sub3 elementin. muokataan hieman tuota koodia.

      Haetaan siis kaikki divit listaan.

      $divit = getElementsByTagName("div");

      Käydään lista läpi

      for($i = 0; $i < $divit -> length; $i ){
      if($divit -> item($i) -> hasAttribute("sub3")){
      echo $divit -> item($i) -> textContent;
      }
      }

      Selkenikö?

      • simusimu

        Hieman selkeytti, mutta vielä jäi se että miten saan ne div elementit kaivettua esim. osoitteesta joka on muotoa osoite.com/en/sivu ?


      • teuro
        simusimu kirjoitti:

        Hieman selkeytti, mutta vielä jäi se että miten saan ne div elementit kaivettua esim. osoitteesta joka on muotoa osoite.com/en/sivu ?

        Sinun täytyy hakea se sivu itsellesi ensin vaikkapa loadHTMLfile("osoite"); Tämän jälkeen voit hakea edellä mainitulla tavalla tiedot.

        Eli siis


        Jotenkin noin sitä voisi alkaa rakentelemaan, mutta pidä huolto, että jos tiedon paikka muuttuu tämä ei anna oikeaa tietoa ulos. Tosin tämä tulostaa siis kaikkien elementtien sisällön.


      • syystä tämmöinen
        teuro kirjoitti:

        Sinun täytyy hakea se sivu itsellesi ensin vaikkapa loadHTMLfile("osoite"); Tämän jälkeen voit hakea edellä mainitulla tavalla tiedot.

        Eli siis


        Jotenkin noin sitä voisi alkaa rakentelemaan, mutta pidä huolto, että jos tiedon paikka muuttuu tämä ei anna oikeaa tietoa ulos. Tosin tämä tulostaa siis kaikkien elementtien sisällön.

        Mistä syystä tulee tämmöinen virheilmoitus Fatal error: Call to undefined method: domdocument->loadhtmlfile()

        Kun yrittää parsia sivua kasaan?


      • 5 phptä
        syystä tämmöinen kirjoitti:

        Mistä syystä tulee tämmöinen virheilmoitus Fatal error: Call to undefined method: domdocument->loadhtmlfile()

        Kun yrittää parsia sivua kasaan?

        Taisi löytyäkin ratkaisu... Ei ole php5 käytössä vaikka sivuilla niin luvataankin.

        komennolla: phpinfo();

        PHP4u Version 3.0
        Based on PHP-4.4.6

        Onnistuuko tuo jotenkin vanhemmissa versioissa?


    • asddfasfdasdf

      • asddfasfdasdf

        Tuo puolipisteen heti osoitteen päättävän heittomerkin jälkeen on suomi24 systeemin lisäämä, joten se ei kuulu tuohon koodiin.


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Porvarimediat paniikissa demareiden huiman kannatuksen vuoksi

      Piti sitten keksiä "nimettömiin lähteisiin" perustuen taas joku satu. Ovat kyllä noloja, ja unohtivat sen, että vaalit
      Maailman menoa
      104
      6684
    2. KATASTROFI - Tytti Tuppurainen itse yksi pahimmista kiusaajista!!!

      STT:n lähteiden mukaan SDP:n eduskuntaryhmän puheenjohtaja Tytti Tuppurainen on käyttäytynyt toistuvasti epäasiallisesti
      Maailman menoa
      370
      6264
    3. Mikä siinä on ettei persuille leikkaukset käy?

      On esitetty leikkauksia mm. haitallisiin maataloustukiin, kuin myös muihin yritystukiin. Säästöjä saataisiin lisäksi lei
      Maailman menoa
      60
      3123
    4. Lääppijä Lindtman jäi kiinni itse teosta

      Lindtman kyselemättä ja epäasiallisesti koskettelee viestintäpäällikköä. https://www.is.fi/politiikka/art-2000011780852
      Maailman menoa
      111
      2604
    5. Juuri nyt! Tytti Tuppurainen on käyttäytynyt toistuvasti epäasiallisesti

      Ai että mä nautin, Tytti erot vireille! "Käytös on kohdistunut avustajia ja toisia kansanedustajia kohtaan, uutisoi STT
      Maailman menoa
      107
      2256
    6. Onko kaivattusi

      liian vetovoimainen seksuaalisesti?
      Ikävä
      125
      1814
    7. Puolen vuoden koeaika

      Voisi toimia meillä. Ensin pitäis selvittää "vaatimukset" puolin ja toisin, ennen kuin mitään aloittaa. Ja matalalla pro
      Ikävä
      19
      1673
    8. Huomaatteko Demari Tytti ei esitä pahoitteluitaan

      Samanlainen ilmeisesti kuin Marin eli Uhriutuu no he ovat Demareita ja muiden yläpuolella siis omasta mielestään
      Maailman menoa
      34
      1395
    9. Tytti Tuppurainen nöyryyttää avustajiaan

      Tytti Tuppurainen nöyryyttää SDP:n eduskuntaryhmän kokouksissa sekä avustajia että kansanedustajia. Hän nolaa ihmisiä ju
      Kotimaiset julkkisjuorut
      181
      1350
    10. On todella hassua

      Ajatella että pitäisit erityisen kuumana tai seksikkäänä?
      Ikävä
      73
      1237
    Aihe