Napadlo mě, že bych mohl najít všechny .cz domény na nichž běží běží weby poháněné frameworkem Nette. Ten nápad mi připadal dostatečně zbytečný a tak nic nebránilo realizaci.
Plán akce byl následující:
- Ze nějakých stránek
jsem s pomocí utilitky
Curla seznamu proxy serverů zkopíroval jejich databázi .cz domén. Ti chytráci měli nastavený limit požadavků, které můžou pocházet z jedné IP adresy. Nejspíš aby jim někdo nevykrádal stránky. Takhle se jim podaří útočníky nejevýš lehce zpomalit. - Pak jsem v Geditu pomocí daru přítele Regexe vyextrahoval samotná url. Mimochodem: Gedit má tak žalostně pomalou funkci najdi a nahraď, že jsem se dokonce odhodlal podívat do zdrojáků, kde je zakopaný pes. Našel jsem příčinu, ale jelikož je to C a používají se tam nějaké funkce GTK+, ve kterém se skoro vůbec nevyznám, nechal jsem to plavat. Zas tak často to nevyužiju.
- Následoval cyklický dvoj-chvat
Curl -I -m 10 "$url" >>headers, kterým jsem načítal a ukládal jednotlivé hlavičky, případně ještě sledoval redirecty a ukládal hlavičky těchto přesměrování (ukázalo se, že mnoho webů se takhle schovávalo). - V tu chvíli už byl potřeba jenom čas. Hodně času. Zatracená kvanta času. Bylo mi jasné, že poslat skoro sto padesát tisíc HTTP požadavků bude trvat dlouho. Přesto jsem byl překvapený. Skript běžel víc jak 30 hodin v kuse. Pravda, mohl jsem spustit několik jakoby-vláken, ale zas tak jsem se s tím nechtěl párat.
Výsledky jsou následující:
- Prohledal jsem 115204 .cz domén.
- Následoval jsem 31324 redirectů.
- Našel jsem 62 domén s webovou aplikací poháněnou
Nette (resp. vracejících HTTP hlavičku
X-Powered-By: Nette Framework), což znamená každá 1858.
Výherci jsou následující:
- absolvent.cz
- absolventi.cz
- ak-luzova.cz
- alpingroup.cz
- arakolin.cz
- arakolin.cz
- autohobby.cz
- autohobby.cz
- bomba.cz
- brejla.cz
- codeware.cz
- cokolada.cz
- danceperfect.cz
- dcd.cz
- ddmp6.cz
- dianthe.cz
- doucovani.cz
- drevospektrum.cz
- elephant-traffic.com
- filadelfia.cz
- gepard-mb.cz
- goldway.cz
- grantis.cz
- jillylenau.cz
- jozak.cz
- kameny.cz
- k47.cz
- lesoservis.cz
- maxon.cz
- mesec.cz
- mhdfoto.cz
- mojeterasa.cz
- nakole.cz
- n-joy.cz
- noa.cz
- opalka.cz
- peach.cz
- plynovespotrebice.cz
- potrva.cz
- praktika.cz
- prodejzajezdu.cz
- raport.cz
- raport.cz
- rcsoft.cz
- romania.cz
- root.cz
- rsdevelopment.cz
- rykala.cz
- semerad-rally.cz
- smsmania.cz
- spminstrument.cz
- svetskrini.cz
- swallow.cz
- upcr.cz
- vitalia.cz
- wdk.cz
- zofinka.cz
- zsnovolisenska.cz
Doufám, že při příštím měření najdu aspoň desetkrát více domén se srdcem Nette.


Jmenuji se K., v síti také známý jako
komentáře
Vtip je v tom, že jich je 10× víc :D
Tvůj skript asi započítá jen ty domény, kde neprobíhá přesměrování na verzi s www. (či jinou subdoménu), např. tam nevidím ani jeden svůj web :)
[768] Problém je hlavně v tom, že jsem bral nějaký seznam, kde ani zdaleka nebyly všechny cz domény.