Topic: Indeksavimas paieshkai

Naudoju InnoDB mysql varikli, tad kuriamos sistemos lentelese fulltext paieshkos neis vykdyti, reikia pasidaryti sava indeksavimo mechanizma;

Jei daryti teksto anglu kalba indeksavima, viskas kaip ir daugiau mazhiau daugiau aishku:
1. verchiam i lowercase, explodinam i masyva;
2. ish indeksuojamo teksto masyvo trinam vadinamus 'stop-words' ('i', 'and', ...);
3. darom zhodzhiu apkarpyma (stem) - http://www.tartarus.org/~martin/PorterStemmer/;

O ka daryti su punktu Nr.3 lietuviu kalboj, gal kas bandet savo algoritma lietuviu klabos zhodzhiams apkarpyti sukurti?:)

Idomu kokiu principu indeksavima darot (jei darot) pas save?

shaltinis: http://www.symfony-project.com/askeet/21

Re: Indeksavimas paieshkai

La,

Na manau tau niekas labai netrukdo sukurti lygiagrečiai papildomą lentelę veikiančia MyISAM variklo pagrintu specialiai FULLTEXT indeksavimui, kurioje gali atlikti paiešką.