Olispa edes semanttinen teksti-tv

KN$

Ongelma on aina se, kun valtava tietomassa, luonnollisella kielellä kirjoitettu teksti, pitäisi saada toimimaan järjestelmässä, lakimiehien, tutkijoiden ja tietysti muiden tavistenkin kesken. Eli olemaan riippumaton vain ihmisen tulkinnan varaisista havainnoista.

Lojban-kieli on siis sitä että teksti itsessään kirjoitetaan niin säännönmukaisesti, että voidaan käyttää tietokonetta apuna sen "käyttämisessä". Hyvää siinä on että aivan kaikki joka kirjoitetaan on säännönmukaista ja siten tietokoneella ja ihmisellä on sama maksimaalinen liittymä tekstiin.

Kuitenkin jo raamattu on omalla tavallaan nerokkaasti järjestetty. Jaettu yksiköihin joihin voi viitata samalla tavalla kun nyt viitataan www-osoitteisiin. (Tämä ei taida olla aina niin täsmällistä mutta kuitenkin...) Raamattuun viitaten syntyy siis semanttisia listoja joissa tiettyä teemaa käsittelevät jakeiden "osoitteet" kerätään listaksi. (Kirjasta itsestään ei silti näe mistä siihen on viitattu.)

Siitä voisi vetää tietyn kehitys viivan "teknisen semantiikan" kehityksessä, eli kuinka suuri osa kielestä on kulloinkin säännönmukaista. Eihän nykyweb näytä lainkaan kehittyvän lineaarisesti kohti lojbania?

Voisipa edes teksti-tv:ssä olla aiheluettelo aakkosellisen luettelon sijaan.

5

1290

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • "Eihän nykyweb näytä lainkaan kehittyvän lineaarisesti kohti lojbania? "

      Kehittyykö edes kohti semanttista webiä ja millä aikavälillä? Jos, niin minulla on hytinä, että lojban pitää huolen itsestään. Se on ehkä enemmän elossa projektina, kuin semanttinen web näyttää ulospäin olevan. Vanhat 5v takaiset aikataulut ovat kusseet, mutta tämä dokumentti kertoo, että jotakin tapahtuu:

      http://project10x.com/prods/bxbcsk/exsum_sw2008.pdf

      Sain tämän osoitteen vastaamalla ensin kyselyyn. Toivottavsti se toimii muutenkin.

      • KN$

        Minullakin on pienet projektit niin Lojbanista kuin "semanttisesta teksti-tv:stäkin".


      • KN$ kirjoitti:

        Minullakin on pienet projektit niin Lojbanista kuin "semanttisesta teksti-tv:stäkin".

        Olisiko järkevää keskustella "lojban-teknisistä" kysymyksistä ja projektien yksityiskohdista tuolla erityisfoorumilla, jonka pistin pystyyn "Hopeatikarin" aloittesta "tulevaan käyttöön". Olen pistänyt sinne rekisteröitipakon pitääksen häiriköt poissa, mutta rekisteröinti ei liene suuri vaiva.
        http://suomilojban.15.forumer.com/index.php?s=9435e0820a72de5711d3a1ce4a908ebe&act=SF&f=3&st=
        Kuka vaan voi rekisteröityä, mutta häiriköt ainakaan eivät viitsi vaivautua.
        Yleistä keskustelua on ajoittain hyvä jatkaa täällä.


      • KN$
        Yusa kirjoitti:

        Olisiko järkevää keskustella "lojban-teknisistä" kysymyksistä ja projektien yksityiskohdista tuolla erityisfoorumilla, jonka pistin pystyyn "Hopeatikarin" aloittesta "tulevaan käyttöön". Olen pistänyt sinne rekisteröitipakon pitääksen häiriköt poissa, mutta rekisteröinti ei liene suuri vaiva.
        http://suomilojban.15.forumer.com/index.php?s=9435e0820a72de5711d3a1ce4a908ebe&act=SF&f=3&st=
        Kuka vaan voi rekisteröityä, mutta häiriköt ainakaan eivät viitsi vaivautua.
        Yleistä keskustelua on ajoittain hyvä jatkaa täällä.

        En päässyt kirjautumaan foorumille, mutta listaan tähän joitakin oleellisia päätoimintoja jotka kiinnostavat Lojban-kielen koneellisessa käsittelyssä.

        - Lojban-tekstin parsiminen ja muuntaminen käsitekartaksi, tietokannaksi jne. Ei pitäisi olla vaikea mutta en ole vielä kokeillut.

        - Käsitekartan (ja siis tekstin) oikeellisuuden tarkastaminen kovakoodaamalla ehdot, kuten "isä ei voi olla nainen".

        - Käsitekartan oikeellisuuden tarkastaminen toisella käsitekartalla. Jos toisessa käsitekartassa mainitaan että "isä ei ole nainen" ja toisessa tällainen kuitenkin ilmenee, todetaan ristiriita.

        - Kyselyihin vastaaminen suoraan.

        - Kyselyihin vastaaminen "arvaamalla". Jos veljen isä on Matti, on tämän isäkin matti. Päättelysäännöt voidaan määrittää joko kovakoodaamalla tai erillisellä käsitekartalla jossa sanotaan "isä on sama kuin sisaruksen isä".

        Tähän asti olen käyttänyt päättelysäännöissä ja tarkastuksissa kovakoodausta. Sekin toimii yllättävän hyvin kapeassa tehtävässä. (Sukupuun kuvaamisessa.)


      • KN$ kirjoitti:

        En päässyt kirjautumaan foorumille, mutta listaan tähän joitakin oleellisia päätoimintoja jotka kiinnostavat Lojban-kielen koneellisessa käsittelyssä.

        - Lojban-tekstin parsiminen ja muuntaminen käsitekartaksi, tietokannaksi jne. Ei pitäisi olla vaikea mutta en ole vielä kokeillut.

        - Käsitekartan (ja siis tekstin) oikeellisuuden tarkastaminen kovakoodaamalla ehdot, kuten "isä ei voi olla nainen".

        - Käsitekartan oikeellisuuden tarkastaminen toisella käsitekartalla. Jos toisessa käsitekartassa mainitaan että "isä ei ole nainen" ja toisessa tällainen kuitenkin ilmenee, todetaan ristiriita.

        - Kyselyihin vastaaminen suoraan.

        - Kyselyihin vastaaminen "arvaamalla". Jos veljen isä on Matti, on tämän isäkin matti. Päättelysäännöt voidaan määrittää joko kovakoodaamalla tai erillisellä käsitekartalla jossa sanotaan "isä on sama kuin sisaruksen isä".

        Tähän asti olen käyttänyt päättelysäännöissä ja tarkastuksissa kovakoodausta. Sekin toimii yllättävän hyvin kapeassa tehtävässä. (Sukupuun kuvaamisessa.)

        "En päässyt kirjautumaan foorumille"

        Rekisteröin itselleni kokeeksi juuri toisen Käyttäjätunnuksen. Se oli helppoa, kaavakkeeseen:
        Käyttäjätunnus: Karvajalka
        Uusi salasana kaksi kertaa.
        Sähköposti, johon tulee vahvistus.
        Vahvistusmeilissä on linkki foorumiin, jossa kysyttiin vielä käyttäjätunnusta: Karvajalka.

        Sitten pääsen tunnuksella ja salasanalla lokkaamaan foorumille.

        "- Lojban-tekstin parsiminen ja muuntaminen käsitekartaksi, tietokannaksi jne. Ei pitäisi olla vaikea mutta en ole vielä kokeillut. "

        Kun nyt kesäloman kuluessa saan "oppikirjan" johonkin valmiustilaan (on se jo kohtuullinen, mutta eteenkin järkevien esimerkkien keksiminen on hitain vaihe), aloitan "lojboti" ohjelmaprojektin, joka tekee juuri kaikkia noita. Havasin MIT-botti, "jimpe", on tehty lähinnä pythonilla. Minä aion käyttää C :aa. Tarkoitukseni on tehdä PEG-parseri.

        Kerron myöhemmin linkin noihin Havasin koodeihin. Kaikkea muutakin valmista löytyy.


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Persujen mukaan rasismi on huumoria

      Vaan kun koomikko kutsui Halla-ahoa fasistiksi, niin piti haastaa oikeuteen. Mihin se huumorinitaju yhtäkkiä hävisi? ⠀
      Maailman menoa
      248
      6409
    2. Rasismia kaikkialla näkevät ovat Suomen tyhmimpiä ihmisiä

      ja monillahan kuluu myös mielialalääkkeitä, eli päässä on ongelmia. Mutta he eivät tajua kuinka paljon ja ihan todellis
      Maailman menoa
      196
      5956
    3. Ei kahta sanaa etteikö Petteri Orpo hyväksy rasismia

      Koska jatkaa hallituksessa rasistisen perussuomalaisiksi itseään kutsuvan puolueen kanssa. Se on Petteri Orpon arvomaai
      Maailman menoa
      17
      5499
    4. Mitkäs nuorisoporukat ovat toisia nuoria ryöstelleet (selvää rassismia)

      No poliisi kertoo, että maahanmuuttajataustaisia ovat, ja isot porukat sillä yhden suomalaisen uhrin kimpussa on ollut j
      Maailman menoa
      101
      4247
    5. Hallitus on kaadettava ja Orpon on erottava

      Mikään muu hallitus ei ole oman elämäni aikana tuhonnut näin paljon tämän maan taloutta ja työllisyyttä sekä suomen main
      Maailman menoa
      143
      3523
    6. Lasse Lehtonen vaatii persuja pyytämään anteeksi aasialaisilta

      Persut ova romahduttaneet Suomen maakuvan parissa päivässä negatiiviseksi rasismillaan ja se alkaa vaikuttamaan jo Suome
      Maailman menoa
      130
      3343
    7. HS 12/25 kysely: persut romahti, demarit raketoi

      Kyyti on kylmää persuleirissä, saattaa vetää siellä silmätkin viirulleen. Sen sijaan SDP:n puoluetoimistolla voidaan pok
      Maailman menoa
      23
      3046
    8. Töppö-persut ovat todella tyhmiä

      sen kertoo tämäkin avaus: "Persujen suosio vain laskee" Töppö-persu vaan unohtaa, että ennen tätä galluppia persujen kan
      Maailman menoa
      8
      2502
    9. Rasismi rapauttaa Suomen mainetta ja hallituksen hiljaisuus pahentaa vahinkoa

      Finnairin viesti Japanista on pysäyttävä: suomalaisen politiikan rasismikohut heijastuvat suoraan matkustuspäätöksiin ja
      Maailman menoa
      263
      2459
    10. Lasse Lehtonen palasi ambulanssilennolla Suomeen

      Nyt on syytä lopettaa irvailu.
      Maailman menoa
      133
      2306
    Aihe