Olispa edes semanttinen teksti-tv

KN$

Ongelma on aina se, kun valtava tietomassa, luonnollisella kielellä kirjoitettu teksti, pitäisi saada toimimaan järjestelmässä, lakimiehien, tutkijoiden ja tietysti muiden tavistenkin kesken. Eli olemaan riippumaton vain ihmisen tulkinnan varaisista havainnoista.

Lojban-kieli on siis sitä että teksti itsessään kirjoitetaan niin säännönmukaisesti, että voidaan käyttää tietokonetta apuna sen "käyttämisessä". Hyvää siinä on että aivan kaikki joka kirjoitetaan on säännönmukaista ja siten tietokoneella ja ihmisellä on sama maksimaalinen liittymä tekstiin.

Kuitenkin jo raamattu on omalla tavallaan nerokkaasti järjestetty. Jaettu yksiköihin joihin voi viitata samalla tavalla kun nyt viitataan www-osoitteisiin. (Tämä ei taida olla aina niin täsmällistä mutta kuitenkin...) Raamattuun viitaten syntyy siis semanttisia listoja joissa tiettyä teemaa käsittelevät jakeiden "osoitteet" kerätään listaksi. (Kirjasta itsestään ei silti näe mistä siihen on viitattu.)

Siitä voisi vetää tietyn kehitys viivan "teknisen semantiikan" kehityksessä, eli kuinka suuri osa kielestä on kulloinkin säännönmukaista. Eihän nykyweb näytä lainkaan kehittyvän lineaarisesti kohti lojbania?

Voisipa edes teksti-tv:ssä olla aiheluettelo aakkosellisen luettelon sijaan.

5

1289

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • "Eihän nykyweb näytä lainkaan kehittyvän lineaarisesti kohti lojbania? "

      Kehittyykö edes kohti semanttista webiä ja millä aikavälillä? Jos, niin minulla on hytinä, että lojban pitää huolen itsestään. Se on ehkä enemmän elossa projektina, kuin semanttinen web näyttää ulospäin olevan. Vanhat 5v takaiset aikataulut ovat kusseet, mutta tämä dokumentti kertoo, että jotakin tapahtuu:

      http://project10x.com/prods/bxbcsk/exsum_sw2008.pdf

      Sain tämän osoitteen vastaamalla ensin kyselyyn. Toivottavsti se toimii muutenkin.

      • KN$

        Minullakin on pienet projektit niin Lojbanista kuin "semanttisesta teksti-tv:stäkin".


      • KN$ kirjoitti:

        Minullakin on pienet projektit niin Lojbanista kuin "semanttisesta teksti-tv:stäkin".

        Olisiko järkevää keskustella "lojban-teknisistä" kysymyksistä ja projektien yksityiskohdista tuolla erityisfoorumilla, jonka pistin pystyyn "Hopeatikarin" aloittesta "tulevaan käyttöön". Olen pistänyt sinne rekisteröitipakon pitääksen häiriköt poissa, mutta rekisteröinti ei liene suuri vaiva.
        http://suomilojban.15.forumer.com/index.php?s=9435e0820a72de5711d3a1ce4a908ebe&act=SF&f=3&st=
        Kuka vaan voi rekisteröityä, mutta häiriköt ainakaan eivät viitsi vaivautua.
        Yleistä keskustelua on ajoittain hyvä jatkaa täällä.


      • KN$
        Yusa kirjoitti:

        Olisiko järkevää keskustella "lojban-teknisistä" kysymyksistä ja projektien yksityiskohdista tuolla erityisfoorumilla, jonka pistin pystyyn "Hopeatikarin" aloittesta "tulevaan käyttöön". Olen pistänyt sinne rekisteröitipakon pitääksen häiriköt poissa, mutta rekisteröinti ei liene suuri vaiva.
        http://suomilojban.15.forumer.com/index.php?s=9435e0820a72de5711d3a1ce4a908ebe&act=SF&f=3&st=
        Kuka vaan voi rekisteröityä, mutta häiriköt ainakaan eivät viitsi vaivautua.
        Yleistä keskustelua on ajoittain hyvä jatkaa täällä.

        En päässyt kirjautumaan foorumille, mutta listaan tähän joitakin oleellisia päätoimintoja jotka kiinnostavat Lojban-kielen koneellisessa käsittelyssä.

        - Lojban-tekstin parsiminen ja muuntaminen käsitekartaksi, tietokannaksi jne. Ei pitäisi olla vaikea mutta en ole vielä kokeillut.

        - Käsitekartan (ja siis tekstin) oikeellisuuden tarkastaminen kovakoodaamalla ehdot, kuten "isä ei voi olla nainen".

        - Käsitekartan oikeellisuuden tarkastaminen toisella käsitekartalla. Jos toisessa käsitekartassa mainitaan että "isä ei ole nainen" ja toisessa tällainen kuitenkin ilmenee, todetaan ristiriita.

        - Kyselyihin vastaaminen suoraan.

        - Kyselyihin vastaaminen "arvaamalla". Jos veljen isä on Matti, on tämän isäkin matti. Päättelysäännöt voidaan määrittää joko kovakoodaamalla tai erillisellä käsitekartalla jossa sanotaan "isä on sama kuin sisaruksen isä".

        Tähän asti olen käyttänyt päättelysäännöissä ja tarkastuksissa kovakoodausta. Sekin toimii yllättävän hyvin kapeassa tehtävässä. (Sukupuun kuvaamisessa.)


      • KN$ kirjoitti:

        En päässyt kirjautumaan foorumille, mutta listaan tähän joitakin oleellisia päätoimintoja jotka kiinnostavat Lojban-kielen koneellisessa käsittelyssä.

        - Lojban-tekstin parsiminen ja muuntaminen käsitekartaksi, tietokannaksi jne. Ei pitäisi olla vaikea mutta en ole vielä kokeillut.

        - Käsitekartan (ja siis tekstin) oikeellisuuden tarkastaminen kovakoodaamalla ehdot, kuten "isä ei voi olla nainen".

        - Käsitekartan oikeellisuuden tarkastaminen toisella käsitekartalla. Jos toisessa käsitekartassa mainitaan että "isä ei ole nainen" ja toisessa tällainen kuitenkin ilmenee, todetaan ristiriita.

        - Kyselyihin vastaaminen suoraan.

        - Kyselyihin vastaaminen "arvaamalla". Jos veljen isä on Matti, on tämän isäkin matti. Päättelysäännöt voidaan määrittää joko kovakoodaamalla tai erillisellä käsitekartalla jossa sanotaan "isä on sama kuin sisaruksen isä".

        Tähän asti olen käyttänyt päättelysäännöissä ja tarkastuksissa kovakoodausta. Sekin toimii yllättävän hyvin kapeassa tehtävässä. (Sukupuun kuvaamisessa.)

        "En päässyt kirjautumaan foorumille"

        Rekisteröin itselleni kokeeksi juuri toisen Käyttäjätunnuksen. Se oli helppoa, kaavakkeeseen:
        Käyttäjätunnus: Karvajalka
        Uusi salasana kaksi kertaa.
        Sähköposti, johon tulee vahvistus.
        Vahvistusmeilissä on linkki foorumiin, jossa kysyttiin vielä käyttäjätunnusta: Karvajalka.

        Sitten pääsen tunnuksella ja salasanalla lokkaamaan foorumille.

        "- Lojban-tekstin parsiminen ja muuntaminen käsitekartaksi, tietokannaksi jne. Ei pitäisi olla vaikea mutta en ole vielä kokeillut. "

        Kun nyt kesäloman kuluessa saan "oppikirjan" johonkin valmiustilaan (on se jo kohtuullinen, mutta eteenkin järkevien esimerkkien keksiminen on hitain vaihe), aloitan "lojboti" ohjelmaprojektin, joka tekee juuri kaikkia noita. Havasin MIT-botti, "jimpe", on tehty lähinnä pythonilla. Minä aion käyttää C :aa. Tarkoitukseni on tehdä PEG-parseri.

        Kerron myöhemmin linkin noihin Havasin koodeihin. Kaikkea muutakin valmista löytyy.


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Minkähän takia ns. persuille ei tunnu työ maistuvan?

      Vaikuttavat olevan joutoväkeä syystä tai toisesta  – työttömiä tai työeläkeloisia. Muiden rahoilla pötköttelevää väkeä,
      Maailman menoa
      67
      2483
    2. Suomen veroaste 5 %-yks liian matala

      Palauttamalla kokonaisveroaste 1990-luvun tasolle saadaan hyvinvointivaltion palvelut rahoitettua ilman velan ottoa.
      Maailman menoa
      105
      2147
    3. Olit ihan

      Kiihkona silloin. Sen näki ja lähes tunsi. Ei tainnut olla kaukana et olisit vetänyt lähellesi jos siihen olisi hetki tu
      Ikävä
      24
      2127
    4. Kolme neljästä suomalaisesta kannattaa miljonääriveroa

      Kertoo vasemmistoliiton teettämä kysely. Veron ulkopuolelle jätettäisiin asunto. "Puolet vastaajista oli sitä mieltä, e
      Maailman menoa
      97
      2097
    5. Kyllä on Vasemmistoliitosta Koskelan johdolla tullut todellinen ääripuolue

      se on niin tulipunainen kuin olla voi, ja selvästi haluaa jatkuvasti eripuraa, ja repiä kansaa kahtia. Siinä on jo vuod
      Maailman menoa
      8
      2026
    6. MTV: Harvinainen haastattelu! Vappu Pimiä kommentoi vihdoinkin uutta TTK-juontajaa

      TTK-juontajaspekuloinnit käyvät edelleen kuumana. Kenet sinä haluaisit uudeksi TTK-juontajaksi? Kommentoi alle! Lue,
      Suomalaiset julkkikset
      14
      1875
    7. Evoluutioon ja alkuräjähdykseen uskominen vaatii todella vahvaa uskoa

      Että tyhjästä syntyi ja kehittyi kaikki se mitä näemme ympärillämme.
      Luterilaisuus
      581
      1826
    8. Trump huonommassa kunnossa kuin Usasta virallisesti sanotaan?

      "Terveys on vakaa mutta ei normaali".Uskallan melkein sanoa,että Trumpin terveydentilaa kaunistellaan.Myös se että se nu
      Maailman menoa
      107
      1743
    9. Yleveron tuotto siirrettävä S-ryhmälle

      Yleisradio on mukana kansanmurhassa. Tuollaista ei voi tukea verovaroin. S-ryhmä on ainoa selkärankainen iso toimija S
      Maailman menoa
      17
      1657
    10. Mikä ihme teitä lieksalaisia tuossa

      p*rs*reiässä niin kiinnostelee? Että siitä pitää päntönnään huutaa?
      Lieksa
      61
      1609
    Aihe