Liane BBS: CZdatabases: Re: Indexy

Posted By: medved (A~z na v~eky Mikov~ce.) on 'CZdatabases' Title: Re: Indexy Date: Fri Apr 26 13:14:52 2002 > Zdarec, > > mam za ukol zindexovat adresy (tj. varchary, nebo v nejlepsim chary s fixni > velikosti se spoustou mezer) na zhruba 60 milionech zaznamech. Ne v > databazi, > data sou ve fixed width souborech (flat souborech), kvuli rychlosti. Takze, To by me zajimalo proc. Leda ze to lezi na mainframe a i tam je to v databazi (te, co je zadratovana na radici disku). > mohli by ste me nekdo popostrcit na stranky kde se probiraj styly indexovani > dat? Pripadne, delal ste to nekdo? Jak? A jak by ste na to sli kdyby ste to > meli delat, jak to delaj velky databaze, binarnima stromama? Diky za > jakykoli udaj co me popostrci ... Zalezi na tom, jak chces ta data zpracovavat. Klasicke relacni databaze jsou navrzeny na transakcni zpracovani - potrebujes pracovat s nekolika zaznamy, ale s CELYMI zaznamy. Nejefektivnejsi vyhledavani (ktere pouzivaji relacni databaze) jsou binarni stromy (spolu se strankovanim dat). Korenova indexova stranka ma v sobe hodnoty a ukazatele na dalsi podrizene indexove stranky az dojdes na listy, ktere ukazuji na stranky s daty. (velmi zjednoduseno) Druhy zpusob ala datove sklady - analyticky - u nej potrebujes vedet jeden (ci nekolik malo) atributu prez vsechny zaznamy (napr. plat a majetek ;-). Tady se vyplati mit data ulozena jinak - po sloupcich a to treba az na jednotlive bity (bit 0 platu, bit 1 platu, bit 2 platu). Nad timto muzes dale delat kompresi, ktera vyrazne urychli pristup k datum. Ale dej si pozor. Tyto zpusoby indexovani jsou sice priserne rychle (az 1000x nez klasicke indexovani) ale take patentove chranene... > Jerry III Bye Medved Si vis pacem, para bellum.

Search the boards