k47.cz
mastodon twitter RSS
bandcamp explorer 0xDEADBEEF
««« »»»

ai nájezdníci

— k47

Společnosti provozující ai systémy potřebují surové materiály pro své fungování: výkonné čipy, enegrii a data. Vaše data. Všechny, na které dosáhnou. Teď na internetu probíhá ekvivalent dělení Afriky, kdy ai firmy ukradnou, vše co není přibité. A někdy ani to ne. Kdo se chová trochu lidsky a zodpovědně ke společným statkům a neplundruje web, začne zaostávat v závodě v datovém zbrojení.

Podívejte se na statistiky přístupů na můj bandcamp explorer:

Celkem 1.5 milionu dotazů denně (17.4 každou vteřinu) přicházelo z rozsahu IP adres patřících anthropicu; 75% provozu jen z jedné nenažrané firmy, která chce očividně stáhnout každé unikátní url na internetu.

Mimochodem čísla nejsou definitivní. Nesnažil jsem se určit vlastníka každé ip adresy, jen jsem prohnal pár nejaktivnějších přes whois. Klidně můžou používat moře dalších ipček. Google třeba používá milion různých adres, většina není do grafu započítaná.

BC explorer je malá FCGI aplikace napsaná v jazyce D. Můj cíl bylo strávit méně než jednu milisekundu v aplikační logice včetně všech diskových IO operací a to se mi ±daří i na prehistorickém HW superlevné VPSky (Pamatujete Sandy Bridge?). Sleduje rozložení časů odezvy v grafu vedle. Škoda jen že si tuhle rychlost užívají převážně ai nájezdníci.

Potom, co jsem zablokoval hrstku nejméně přátelských ipček, kanonáda aktivity utichla.

Počet dotazů okamžitě spadl z 2200k/den na 200k/den, aby se během dvou týdnů vyšplhal na 600k/den. Je jasné, že ai firmy svůj hlad po cizích datech dál ukájejí jinými cestami, přes neblokované rozsahy ipček nebo rezidenční proxy. Dva miliony dotazů z jedné adresy člověk snadno zařízne, ale pro dva miliony dotazů ze dvou milionů nakažených počítačů a chytrých lednic to nejde.

V porovnání s plundrováním robotů je přirozený provoz generovaný lidmi zcela minimální.

píše k47, ascii@k47.cz