Posted By: madhouse (Free party is not a crime) on 'CZunix'
Title:     Re: pocitani vyskytu - awk
Date:      Tue Apr 28 23:36:46 2015

Az z tech milionu budou miliony milionu:
http://programio.havrlant.cz/linear-counting/

> Ahoj lidi,
> mam nasledujici libustku: velikansky soubor dat, desitky milionu radku, 
> kde se (znacne) opakuji hodnoty, a tech unikatnich hodnot neni az tak moc 
> (rekneme do tisice, vetsinou dokonce jen desitky).
> 
> Obcas potrebuju spocitat, kolik ceho tam je. Hodil by se mi tedy vypis typu 
> hodnota - count. Nejdriv jsem to bral fakt hrubou silou: 
> for i in `cat | cut | sort -u`; do cat | cut | grep | wc -l; done
> 
> To fungovalo u mensich souboru, u tech milionu a vice radek uz fakt ne. :)
> Samozrejme me opet zachranil awk, ktery to umi na "prvni dobrou", cili jeden
> 
> prujezd bez jakekoli pajpy, tzn. rychlost o nekolik radu jinde. Pokud by
> tedy 
> nekdo potreboval (hodnoty oddelene carkou a to, co me zajima, je 5.
> sloupec): 
> 
> awk -F, '{i[$5]++} END{for (j in i) print i[j], j}'
> 
> 
> Piece of cake. :) 
> 
>  
> jimo:)
>                   [ A project manager is a person who thinks
>                     nine women can deliver a baby in one month. ]
--
Ahoj, ja jsem signatura. Jestli chces, muzes si se mnou hrat..

Search the boards