k47.cz  — každý den dokud se vám to nezačne líbit
foto Praha výběr povídky kultura
twitter FB RSS

Nette@home

31. 12. 2009 — k47 (CC by-nc-sa)

Na­padlo mě, že bych mohl najít všechny .cz domény na nichž běží weby po­há­něné fra­mewor­kem Nette. Ten nápad mi při­pa­dal do­sta­tečně zby­tečný a tak nic ne­brá­nilo re­a­li­zaci.


Plán akce byl ná­sle­du­jící:

  1. Ze ně­ja­kých strá­nek jsem s pomocí uti­litky Curl a se­znamu proxy ser­verů zko­pí­ro­val jejich da­ta­bázi .cz domén. Ti chyt­ráci měli na­sta­vený limit po­ža­davků, které můžou po­chá­zet z jedné IP adresy. Nej­spíš aby jim někdo ne­vy­krá­dal stránky. Takhle se jim podaří útoč­níky neje­výš lehce zpo­ma­lit.
  2. Pak jsem v Geditu pomocí daru pří­tele Regexe vy­ex­tra­ho­val sa­motná url. Mi­mo­cho­dem: Gedit má tak ža­lostně po­ma­lou funkci najdi a nahraď, že jsem se do­konce od­hod­lal po­dí­vat do zdro­jáků, kde je za­ko­paný pes. Našel jsem pří­činu, ale je­li­kož je to C a po­u­ží­vají se tam nějaké funkce GTK+, ve kterém se skoro vůbec ne­vy­znám, nechal jsem to plavat. Zas tak často to ne­vy­u­žiju.
  3. Ná­sle­do­val cyk­lický dvoj-chvat Curl -I -m 10 "$url" >>headers, kterým jsem na­čí­tal a uklá­dal jed­not­livé hla­vičky, pří­padně ještě sle­do­val re­di­recty a uklá­dal hla­vičky těchto pře­smě­ro­vání (uká­zalo se, že mnoho webů se takhle scho­vá­valo).
  4. V tu chvíli už byl po­třeba jenom čas. Hodně času. Za­tra­cená kvanta času. Bylo mi jasné, že poslat skoro sto pa­de­sát tisíc HTTP po­ža­davků bude trvat dlouho. Přesto jsem byl pře­kva­pený. Skript běžel víc jak 30 hodin v kuse. Pravda, mohl jsem spus­tit ně­ko­lik jakoby-vláken, ale zas tak jsem se s tím ne­chtěl párat.

Vý­sledky jsou ná­sle­du­jící:

Vý­herci jsou ná­sle­du­jící:

Doufám, že při příš­tím měření najdu aspoň de­setkrát více domén se srdcem Nette.

píše k47 & hosté, ascii@k47.cz