Vakiodataa Javaohjelmaan ?

Javakoodaaja80

Vakiodataa Javaohjelmaan - miten?

Mikä on paras tapa laittaavakiodataa javaohjelmaan - lähinnä tekstiä.

Kriteerinä tässä tilansäästö - jos (suomenkielistä) tekstiä on paljon, niin javan vakiomerkkijonojen käyttö vie 2 tavua/merkki.

UTF8 -koodauksella ä ja ö veisivät 2 tavua/merkki, kaikki muut 1 tavu/merkki.

Ympäristönä j2me ja matkapuhelin, eli tästä syystä tiedostosta lukeminen ei välttämättä ole järkevää tai edes mahdollista, vaan iso määrä vakiotekstiä pitäisi saada suoraan jar -tiedostoon (käytönnössä siis myös lähdekoodiin)

7

551

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • ((((((((((((((((((((

      --- ESIMERKKI ALKAA ---

      public class VakioTekstit {
         
         public static final String vakioJono= "Vakio dataa";
         
         public static void main(String[] args) {
            System.out.print(vakioJono);
         }
      }


      --- ESIMERKKI LOPPUU ---

      • Javakoodaaja80

        Merkkijonon "Vakio dataa" pituus on 11 merkkiä. Mutta koska java käyttää joko UTF16 -koodausta tai sitten ei edes tue merkkejä, joiden unicode -koodi > 65535, niin valitettavasti esittämälläsi tavalla tuo merkkijono vie tilaa 11*2=22 tavua.

        Tarkoitus oli saada se mahtumaan 11 tavuun.

        Tuo 16 bitin käyttö/merkki voisi olla perusteltua, jos esim. kirjoittaisin kiinalaisia katakana -merkkejä (joita on yli 256, joten ne eivät voi mahtua 1 tavuun/merkki).

        Mutta suomenkielen merkistö on sellainen, jossa käytettäviä merkkejä < 256 erilaista, joten 1 tavu/1 merkki pitäisi olla mahdollista.


      • ((((((((((((((((((
        Javakoodaaja80 kirjoitti:

        Merkkijonon "Vakio dataa" pituus on 11 merkkiä. Mutta koska java käyttää joko UTF16 -koodausta tai sitten ei edes tue merkkejä, joiden unicode -koodi > 65535, niin valitettavasti esittämälläsi tavalla tuo merkkijono vie tilaa 11*2=22 tavua.

        Tarkoitus oli saada se mahtumaan 11 tavuun.

        Tuo 16 bitin käyttö/merkki voisi olla perusteltua, jos esim. kirjoittaisin kiinalaisia katakana -merkkejä (joita on yli 256, joten ne eivät voi mahtua 1 tavuun/merkki).

        Mutta suomenkielen merkistö on sellainen, jossa käytettäviä merkkejä < 256 erilaista, joten 1 tavu/1 merkki pitäisi olla mahdollista.

        Kun kokeilin, niin kyllä tuo merkkijono class -tiedostoon 11 tavuna koodautui, eli 1 tavu/merkki. Jos merkkijonoon laittoi myös skandeja, niin vain skandit koodautuivat kahtena tavuna. Luulisi Javan käyttävän sisäisesti samaa koodausta mitä class tiedostostakin, eli niin että tuo vie muististakin sen 11 tavua.


      • ((((((((((((((((((
        (((((((((((((((((( kirjoitti:

        Kun kokeilin, niin kyllä tuo merkkijono class -tiedostoon 11 tavuna koodautui, eli 1 tavu/merkki. Jos merkkijonoon laittoi myös skandeja, niin vain skandit koodautuivat kahtena tavuna. Luulisi Javan käyttävän sisäisesti samaa koodausta mitä class tiedostostakin, eli niin että tuo vie muististakin sen 11 tavua.

        Tosiaan kun string olio ladataan muistiin, vie se yksi merkki sen jälkeen 2 tavua, koska stringin luokan sisällä on näköjään "private final char value[]" muuttuja merkkijonon säilytykseen.


      • javakoodaaja80
        (((((((((((((((((( kirjoitti:

        Tosiaan kun string olio ladataan muistiin, vie se yksi merkki sen jälkeen 2 tavua, koska stringin luokan sisällä on näköjään "private final char value[]" muuttuja merkkijonon säilytykseen.

        1. Siis onko todellakin niin, että ajoaikaista muistia javan merkkijono kuluttavat 2 tavua/merkki, mutta jar -tiedostossa vain 1 tavu/merkki, poikkeuksena esim. skandimerkit sielläkin 2 tavua/merkki ?

        Eli siis RAM -muistissa UTF-16 tai kiinteä 2 tavua/merkki mutta jar -tiedostossa UTF-8 ?


        JA ...

        2. Onko javan valmisluokkien (esim. string) lähdekoodi jossain saatavilla?

        Asensin joskus Netbeansin, mutta en ainakaan huomannut valmisluokkien lähdekoodeja.

        Enkö vain osannut katsoa oikeaan paikkaan vai pitääkö nuo ladata erikseen netistä ?


      • ((((((((((((((((((
        javakoodaaja80 kirjoitti:

        1. Siis onko todellakin niin, että ajoaikaista muistia javan merkkijono kuluttavat 2 tavua/merkki, mutta jar -tiedostossa vain 1 tavu/merkki, poikkeuksena esim. skandimerkit sielläkin 2 tavua/merkki ?

        Eli siis RAM -muistissa UTF-16 tai kiinteä 2 tavua/merkki mutta jar -tiedostossa UTF-8 ?


        JA ...

        2. Onko javan valmisluokkien (esim. string) lähdekoodi jossain saatavilla?

        Asensin joskus Netbeansin, mutta en ainakaan huomannut valmisluokkien lähdekoodeja.

        Enkö vain osannut katsoa oikeaan paikkaan vai pitääkö nuo ladata erikseen netistä ?

        1.

        Class -tiedostossa käytetään koodausta, jossa vakio merkkijonot koodataan hieman UTF-8 tapaisesti, eli 1 tavu per merkki. Näkyy kun katsoo HEX editorilla class -tiedostoa, alla kuitenkin tarkempi linkki aiheeseen:

        http://java.sun.com/docs/books/jvms/second_edition/html/ClassFile.doc.html#7963

        Jos merkkijono ladataan muistiin char taulukkoon (kuten alla olevissa linkissä olevat String luokien toteutukset tekevät), niin silloin muistiin ladattuna merkkijono vie tilaa 2 tavua per merkki, ellei sitten virtuaalikone tee jotain optimointia.

        http://www.docjar.com/html/api/java/lang/String.java.html
        http://kickjava.com/src/java/lang/String.java.htm

        Sinänsä tuntuu järkevältä, että merkkijono vie muistiin ladattuna aina sen 2 tavua per merkki. Koska jos merkin pituus vaihtelisi muistissa, niin CharAt ja muiden merkin paikasta riippuvien metodien toteutus olisi varsin hankalaa, tai ne olisivat hitaita.


        2.

        En tiedä, googletin vain netistä, mahdollisia toteutuksia. Jotain open source juttuja Sunilla näyttää olevan:

        http://download.java.net/openjdk/jdk6/
        http://openjdk.java.net/


    • hemmoit

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Vain vasemmistolaiset rakennemuutokset pelastavat Suomen

      Kansaa on ankeutettu viimeiset 30+ vuotta porvarillisella minäminä-talouspolitiikalla, jossa tavalliselta kansalta on ot
      Maailman menoa
      19
      3345
    2. Persut huutaa taas: "kato! muslimi!"

      Persut on lyhyessä ajassa ajaneet läpi kaksi työntekijöiden oikeuksien heikennystä, joita se on aiemmin vastustanut. Pe
      Maailman menoa
      9
      2754
    3. Menen nyt koisimaan

      Ja en ehkä palaa tänne. Asia on nyt loppuunkäsitelty ja totuus tuli ilmi
      Ikävä
      28
      2384
    4. Olisiko sinulla

      Jonossa vaihtoehtoja, ehkä
      Ikävä
      42
      1747
    5. KL: Mari Hynynen avoimena - Jouni-rakkaan ja Joel-pojan välit ovat nämä!

      Mari Hynynen (ent. Perankoski) on naimisissa Jouni Hynysen kanssa. Marilla on edellisestä liitosta yksi lapsi, Joel Vola
      Suomalaiset julkkikset
      9
      1384
    6. onko kaivattusi

      vaarallinen? :D
      Ikävä
      41
      1311
    7. Haluaisin rakastaa sinua

      Ja olla sinulle se oikea... Rakastan sinua 💗💗💗
      Ikävä
      8
      1305
    8. Pieni galluppi

      Mitäs lahjaa odotat joulupukilta.
      Ikävä
      40
      1243
    9. Oletko uhriutuja?

      vaikka itse olet rääkännyt toista ja aiheuttanut ties mitä toiselle.
      Tunteet
      52
      1223
    10. Missikohu edustaa nykyajan monimuotoisuutta

      Puolesta vai vastaan, saako esittää pilkkaavasti jonkun toisen ihmisen syntyperäisiä ominaisuuksia? Kadulla vastaan tule
      Sinkut
      259
      1088
    Aihe