1 (edited by dom 2008-06-24 16:39:14)

Topic: preg_match

Sveiki,

Darausi, kad is google istrauktu visus url, ta prasme pagal paieska pvz zaidimai.

Tada naudoju file_get_contents, kad is google url, ir reik kazkaip tik tuos url kur buna po aprasymu ar is <a href="...">... Bandau naudoti REGEXP, bet nieko naudingo neiseina;-) Kad istrauktu tiktai urls ir nieko daugiau nerodytu, tarkim kurie prasideda su www. Kazkaip man su REGEXP neiseina, gal kas galit uzvesti ant kelio?

Re: preg_match

Iš pradžiu reikia suprasti, kad ilgalaikėje veikloje googlas aptiks automatizuotas programines užklausas į paieškos variklį ir pradės mėtyti captchas. Todėl rekomenduoju darant kažką rimto iš karto pereiti prie tam skirto API.

Toliau, norint suprasti kaip kas veikia vistiek reikės bent minimaliai pasimokyti kaip veikia ypraiškos (regular expressions). šiuo momentu tikrai nematau tikslo pateikti gatavą šabloną, turint omenyje, kad googlas keičia savo paieškos rezultatų atvaizdavimą, ir tie šablonai kinta laike.. O kaip juos parašyti tai viskas prasideda nuo googlo html'o analizės - reikia surasti sistemą pagal kurią galima atrinkti norimus rezultatus.