Posted By: medved (A~z na v~eky Mikov~ce.) on 'CZdatabases'
Title:     Re: Indexy
Date:      Fri Apr 26 13:14:52 2002

> Zdarec,
> 
> mam za ukol zindexovat adresy (tj. varchary, nebo v nejlepsim chary s fixni 
> velikosti se spoustou mezer) na zhruba 60 milionech zaznamech. Ne v
> databazi, 
> data sou ve fixed width souborech (flat souborech), kvuli rychlosti. Takze, 

To by me zajimalo proc. Leda ze to lezi na mainframe a i tam je to v databazi 
(te, co je zadratovana na radici disku). 

> mohli by ste me nekdo popostrcit na stranky kde se probiraj styly indexovani
> dat? Pripadne, delal ste to nekdo? Jak? A jak by ste na to sli kdyby ste to 
> meli delat, jak to delaj velky databaze, binarnima stromama? Diky za
> jakykoli udaj co me popostrci ...

Zalezi na tom, jak chces ta data zpracovavat. Klasicke relacni databaze jsou 
navrzeny na transakcni zpracovani - potrebujes pracovat s nekolika zaznamy, 
ale s CELYMI zaznamy. Nejefektivnejsi vyhledavani (ktere pouzivaji relacni 
databaze) jsou binarni stromy (spolu se strankovanim dat). Korenova indexova 
stranka ma v sobe hodnoty a ukazatele na dalsi podrizene indexove stranky az 
dojdes na listy, ktere ukazuji na stranky s daty. (velmi zjednoduseno)

Druhy zpusob ala datove sklady - analyticky - u nej potrebujes vedet jeden 
(ci nekolik malo) atributu prez vsechny zaznamy (napr. plat a majetek ;-). 
Tady se vyplati mit data ulozena jinak - po sloupcich a to treba az na 
jednotlive bity (bit 0 platu, bit 1 platu, bit 2 platu). Nad timto muzes 
dale delat kompresi, ktera vyrazne urychli pristup k datum. Ale dej si pozor. 
Tyto zpusoby indexovani jsou sice priserne rychle (az 1000x nez klasicke 
indexovani) ale take patentove chranene... 

>           Jerry III

Bye

Medved

Si vis pacem, para bellum.

Search the boards