Algoritmin aikakompleksisuudesta

Jos hakukone käyttää binääristä hakupuuta tulosten seulonnassa yhtenä ratkaisunaan tietorakenteista, niin aikakompleksisuus

log2(30 triljoonaa) laskimeni antaa tulokseksi 64.7015963 tarkalleen ottaen tasan, niin kertooko tuo luku tarvittavien hakujen määrän, jotta kaikki puun solmut tulevat käydyksi läpi, jos jokaisella isäsolmulla on kaksi lapsisolmua, eikä puu sisällä yhtään lehteä.

10

370

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Kirjotiin blogiini artikkelin otsikolla "Googlen hakualgoritmi ja sen aikakompleksisuus", kun kerta käytin sunnuntai-iltani aika tehokkaasti tuon binääripuuhaun tutkimiseen. Kaiken lisäksi Google ei käy kaikkia 30 triljoonaa sivua läpi joka hakukerralla, ja näyttääkin vain 10 tulosta per sivu. Eli se voi hakea uusia sivuja omasta tietokannastaan ja omilla mentelmillään säikeistettynä samalla, kun asiakas lukee aiempia hakutulossivuja.

      https://tietokoneblogi.wordpress.com/2017/08/27/googlen-hakualgoritmi-ja-sen-aikakompleksisuus/

    • Tein Twitter-kyselynkin aiheesta, käyttääkö lukijoideni mielestä modernit hakukoneet edes osaksi tietorakenne, tai hyödyntää jonain ilmentymänä binääristä puuhakua, kun tutustuin Ericin kaaviokuvaan.

      Lyhytosoite kyselyyn olisi
      https://goo.gl/tHMpHu

    • engooglellatöissä

      Aika suuria kyselet. Google ei ole tainnut julkistaa hakualgoritmeistansa juuri mitään yleiseen tietoon. Ilmeisesti käyttävät jonkinlaista koneoppimista.

      • engooglellatöissä

        Taisinpa puhua puuta heinää. Koneoppiminen ei taida liittyä itse hakemiseen vaikkakin sitä kai käytetään mm. kuvahaussa tunnistamaan mitä kuvissa esiintyy.

        https://en.wikipedia.org/wiki/PageRank

        Sen siitä saa kun kirjoittaa ennenkun ajattelee.


    • arvelee

      En tiedä mitä tietorakenteita tai hakualgoritmeja hakukoneet käyttävät. Mutta tuskin mitää niin alkeellista kuin binääripuu. Veikkaisin jonkinllaista sumeaa hash-tekniikkaa ensimmäiseksi datan rajaukseksi sekä ehkä rinnakkaisprosessointia syvempään analyysiin. Hakutuloksilla on prioriteetit, ja 1. haku hakee ilmeisesti vain korkeimman prioroteetin tulokset.

    • No joo, mutta binäripuu, jos se on tasapainossa, suoritusaika kasvaa logaritmifunktion mukaan, eli todella nopeasti on käytävissä läpi. Sori, "tasapaino":isella tarkoitan kokonaista tai aitoa binääripuuta. Tuo luku 64 ja risat, jonka sain laskimestani blogiartikkelini taustatietoja kaivaessani viittaa varmaankin puun kokoon 30 triljoonan sivuolion hakutietokantaan, joka Googlella on, eli kyseessä olisi ainoastaan 64 solmuinen binääripuu?

    • ihmettely

      Millähän perusteella meinasit lajitella kaikki internetsivut binääripuuhun? Internetin rakenne taitaa olla hieman monimutkaisempi graafi.

      >log2(30 triljoonaa) laskimeni antaa tulokseksi 64.7015963 tarkalleen ottaen tasan, niin kertooko tuo luku tarvittavien hakujen määrän, jotta kaikki puun solmut tulevat käydyksi läpi, jos jokaisella isäsolmulla on kaksi lapsisolmua, eikä puu sisällä yhtään lehteä.

      Ei. Tuo kertoo maksimivertailujen määrän jolla jokin solmu binääripuusta löytyy. Lehtiähän binääripuussa on väkisinkin mutta ilmeisesti tarkoitat sitä että puu on täydellisesti järjestetty eli toisinsanoen puun korkeus on niin matala kuin voi olla?

    • pikkuvinkki

      Suosittelisin myös käyttämään kotisivusi bannerissa png-tiedostotyyppiä jpg:n sijasta. Antaa aika amatöörimäisen ensivaikutelman noin huonolaatuinen kuva tietokoneaiheisella sivulla.

    • No joo, onhan konekuvani hieman retro niinkuin olen vähän itsekin kait.

      No meinasin sitä, että kun N log(n) on nopein keino etsiä suuresta datajoukosta jotain tietoa, jos Googlen hakurobotit hyödyntää kyseistä tietorakennetta jollain tasolla?

      Google perustettiin vuonna 1998, eli toisin sanoen hakubotit käynnistettiin joko silloin ja aikaisemmin, ja ajan mittaan tietomäärä tosiaan paisunut aika moiseksi ja koko ajan tulee lisää lajiteltavaa tietoa tietokantoihin.

    • Joo, niin kai antaa, muttet ottanut huomioon "tekoälyä", rutiineja, jotka pyyhkivät pölyt random kyselyistä

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Porvarimediat paniikissa demareiden huiman kannatuksen vuoksi

      Piti sitten keksiä "nimettömiin lähteisiin" perustuen taas joku satu. Ovat kyllä noloja, ja unohtivat sen, että vaalit
      Maailman menoa
      42
      5320
    2. Nyt tuli Suomen somaleista todella ikävää faktaa

      sillä osa somalivanhemmista lähettää lapsiaan kotimaahansa kurinpitolaitoksiin, joissa heitä pahoinpidellään. Illan MOT
      Maailman menoa
      413
      4603
    3. Häirintäkohun keskellä olevalta kansanedustajalta Jani Kokolta (sd) rajua tekstiä somessa.

      https://www.is.fi/politiikka/art-2000011772322.html Ajaakohan tämä SDP:n kansanedustaja Jani Kokko oikein täysillä valoi
      Maailman menoa
      148
      3839
    4. KATASTROFI - Tytti Tuppurainen itse yksi pahimmista kiusaajista!!!

      STT:n lähteiden mukaan SDP:n eduskuntaryhmän puheenjohtaja Tytti Tuppurainen on käyttäytynyt toistuvasti epäasiallisesti
      Maailman menoa
      162
      3155
    5. Kommentti: oikeuslaitos korvattava SDP:n johdolla

      Näkisin että Suomessa tuomiovalta pitäisi olla demareiden johtoportaalla. Koska porvarimedia säestettynä persujen kirku
      Maailman menoa
      14
      2526
    6. Mikä siinä on ettei persuille leikkaukset käy?

      On esitetty leikkauksia mm. haitallisiin maataloustukiin, kuin myös muihin yritystukiin. Säästöjä saataisiin lisäksi lei
      Maailman menoa
      21
      2292
    7. Huono päivä

      Tänään on ollut tosi raskas päivä töissä. Tekis mieli itkeä ja huutaa. En jaksa just nyt mitään. Minä niin haluaisin ja
      Ikävä
      18
      2098
    8. Lindtman haluaa leikata Kela-korvauksista...oho!

      Antti Lindtman sanoo Kauppalehdessä, että vuodesta 2028 voi tulla erittäin hankala, mikäli nykyinen hallitus ei tee riit
      Maailman menoa
      151
      2022
    9. Onko kaivattusi spesiaali?

      Millä tavalla ja miten?
      Ikävä
      125
      1940
    10. Typeryyttä

      Se on kummallista, kun kaksi ihmistä tuntee selittämätöntä vetoa toisiinsa, mutta eivät vain pääse toistensa luokse. Mik
      Ikävä
      124
      1469
    Aihe