Posted By: vejpuste (Libor Vejpustek) on 'CZunix'
Title:     Soubor neznameho kodovani
Date:      Wed Dec  5 12:43:33 2007

Mam soubor neznameho kodovani a potreboval bych ho dostat do citelne podoby.
Uz jsem chtel napsat dotaz, ale nakonec jsem zkusil neco udelat sam.
Mozna to pomuze i nekomu dalsimu. Nakonec to nebylo tak hrozne, jak jsem se 
obaval.
Zaklad je programek iconv. iconv -l jsem si vypsal vsechny jemu zname stranky 
do souboru a rozhodil co znakova stranka to radek.
Pak jsem nechal soubor prevest postupne jednou strankou za druhou na CP1250 : 
#!/bin/bash 

KODOVANI=`cat list.txt`
for n in $KODOVANI
do
  echo $n
  iconv -f $n -t CP1250 <1392_13.htm > 1/$n.htm
done

V adresari 1/ se vytvorila spousta souboru, pricemz vetsina skoncila s 
prevodem chybou, takze mela mensi velikost nez puvodni soubor.
Nejvetsi soubory byly nejspravnejsi.

Diky autorovi iconv (Ulrich Drepper), ze mi usetril spoustu prace.

                                        Libor Vejpustek
                                        Ceska zemedelska univerzita Praha
http://web.czu.cz/~vejpuste/            E-mail : vejpuste@uvt.czu.cz

Search the boards