Boooooobs Aby nedošlo k omylu, nejsem vyznavačem žádného kultu - povětšinou neflejmuju co je víc cool ani nemusím mít nutně kdejakou horkou novinku. Můj mobil by mohl vyprávět, zaprášená pandořina skřínka na kterou si dávám nohy taky nemá čtyři ba ani dvě jádra. Jsem absolutně nesynchronizovaný se svým emailovým klientem. Co víc, nejenže nemám IQ 29, ale ani 150 cm dlouhou prostatu (kdo ví, ví ;)).

Pochopitelně mě myšlenka přechodu na linux dráždila už delší dobu. Je tomu už pěkných pár let co jsem otce přemlouval ať mi na jeho novém notebooku nechá zkusit disketovku brutalware(http://www.hysteria.sk/). Přemluvil jsem ho. Dneska první co udělám když vstanu tak se loguju na servery na páteři.

Pokračování…

Z jistých důvodů jsme museli přesunout naší ústřednu na jiné místo. Což znamená změnit DNSka, domluvit s nejmenovaným dodavatelem přesměrování trunku, pozměnit nastavení pár telefonů, které blbec v dřevních dobách nastavil natvrdo na ip adresu a v neposlední řadě odrazit několik nadávek voláníchtivých lidí. Po hodinové eskapádě s kodekama a firewallem bylo hotovo a na ústředně byla zaregistrována cirka polovina telefonů, což není zas až tak špatné číslo jak by se mohlo zdát, osobně jsem čekal horší tragedie. Jelikož svému hlasovému poskytovateli nevolám každý den, připravil jsem si dopředu pár úderných otázek typu co kdyby na Prahu spadla atomovka nebo jestli neumí obejít placení u erotických linek. Nejmenovaný operátor je členem nějaké pochybné asociace, tak si říkám jak jsme to tenkrát dobře vybrali, pokrok především. A jelikož jsme společnost, která jde s dobou a dbá na módní trendy nemohl jsem se nezeptat na ENUM. Jaké překvapení bylo když člověk na druhém konci bezesrandy odpověděl “Eh. Co to je ? O tom jsem nikdy neslyšel ?!”. Pročež jsem tu chvilku trapnosti radši ukončil urychleným rozloučením. Upřímně doufám, že se jako idiot cítí až do teď.

DDOS argumentem (updated)

16. March 2008

Jeden z nejlepších bh blogů a skvělý zdroj bh taktik se v posledních pár dnech zmítal v problémech. Po zveřejnění článku s automatickým řešením staré phpbb captchy(klasika - gocr a imagemagick) se stal terčem poměrně silného botnetu, který Eliho značně profackoval. Pod tíhou útoků článek stáhl a konečně vypnul přesměrování na whitehouse :P Lze z toho odvodit dvě věci, phpbb2 je pro někoho výborný zdroj příjmů a za druhé není radno pouštět do éteru úplně vše.

update: původní info mám z irc kanálu, na fóru wickedfire vysvětluje proč vlastně whitehouse…

the site has been undergoing a huge ddos attack since about 11pm last night. So i forwarded it to whitehouse.gov. I figure if they want to attack anyone they might as well attack a government website. I may be no good at hunting them down but the NSA shouldn’t have too much trouble

rozkošné :P

Dnes má svátek root !

14. March 2008

Tak jsem si chtěl objednat naprosto fenomenální woot monkey, ale není k sehnání takže svůj svátek nemůžu hodnotit jinak než tragicky

woot monkey

graph_imagephp.png

a až na potřetí mi to došlo :) Horší oproti minule bylo, že tentokrát už opravdu kompletně tuhnul server, nutno dodat že poměrně hodně důležitý server a moje reakční doba nebyla jak vidno dostatečně adekvátní. Přesto mám pocit, že za to může spíš perl 5.10 “testing” než moje hc scriptör umění, stejných scraperů jsem napsal už desítky a tenhle není ničím výjimečný…achjo

updated: podezření se nepotvrdilo, idiotem stále zůstává programátor. www::mechanize má tu kouzelnou vlastnost, že si pamatuje všechny stránky zpět dokud se mu to explicitně nezatrhne, takže třeba 1k stránek si vesele se všema objektama ukousne 1g paměti. Dřív jsem se tomu nevědomky vyhnul klonovaním hlavního mecha už ve smyčce…

V poslední době se stává ve světě nesmírně populární LinkEX pro automatickou správu výměny odkazů. Je to velice pohodlná cesta jak fungovat při větším množství webů. Jenže systém má z principu dvě spíše tři slabiny, které dovolí relativně snadno získat spoustu jednostraných linků.

První slabinou je, že systém se nechá lehce oblafnout cloakingem. Kontrola přichází s největší pravděpodobností ze stejné adresy nebo subnetu v které se nachází server. Tedy nabízí se možnost zobrazit link jen pro určitou IP adresu. (pozn. Pokud bychom šli v přemýšlení ještě dál pokud spojíme cloaking a prodej odkazů dostaneme se do úplně nové dimenze businesu a na potencionální penalizace googlu můžeme vklidu zapomenout)

Druhá slabina je Pagerank. V linkexu se nechá nastavit minimální požadovaný pagerank pro výměnu, což má svůj logický důvod, nicméně ne každý pagerank je pravý a o způsobech jak si falešný PR5-7 (keep it real) vyrobit už se párkrát psalo. PR update pak sice překvapí, ale i krátkodobější odkazy mají imho smysl - vzhledem k tomu, že punishment od vyhledávačů nehrozí a příkoří se děje pouze na webmasterech tak nějaké vedlejší efekty nejsou co by nám mohlo trápit.

Třetí slabina je buď žádná captcha nebo naprosto triviální. Přidejme snadno dohledatelný linkex footprint a hra může začít.

Uvedené problémy se netýkají jen a pouze linkexu. Je tu ještě pár dalších automatických nebo poloautomatických potencionálně zneužitelných systémů a mimojiné i důvěra v prodávajícího stojí v tomto světle na velice chatrných základech.

Proč právě Perl ?

30. January 2008

woot !

proto !

jo…a prej jsou java a ruby mrtvý :P

MC Nudes Dneska jsem si chvilku dopisoval s webmasterem MC-Nudes - už delší dobu u nich mám affil account. Kdo nezná, určitě se mrkněte (mc-nudes.com), je to jedna ze sajt na pomyslné kvalitativní špičce softcore produkce, navíc má skvělou výhodu, neuvidíte tam žádnýho zpocenýho idiota jak šermuje se svým pérem před kamerou.

Nicméně, pokud se zrovna snažíte na mc-nudes doklikat a máte IP adresu lokalizovanou v ČR tak budete mít nejspíš stejný problém jako já - 403 Forbidden aneb go fuck yourself. MC-Nudes blokuje veškerý CZ traffic. Důvodů může být několik. Primárně mě napadlo, že pro čechy jako východ Evropy potažmo pro asiaty není výhodné vůbec poskytovat nějaký obsah - náklady na provoz jsou větší než potencionální zisk, je to poměrně pochopitelné, češi mají s placením kreditkou stále problém, nejeden majitel tgp/mgp nás radši přesměruje na content placený přes premium sms nebo placený telefonát, v tomhle ohledu jsme stejně nechtění jako čínani. Druhá možnost, že si to nepřejou samotné dívky - přecejen penetrace českých krásek je v tomhle oboru na světové poměry značná a jejich rodiče jsou většinou “konzervativního rázu”, lépe řečeno je lepší když se to nedoví.

Pokračování…

Mimoto, vřele doporučuju zvědavcům prolézt samotný server ted.com (btw. postaven na Symfony+Dojo). Poměrně fundované přednášky prakticky o čemkoliv a v poutavé podobě od odborníků má uplně jinou úroveň než rádoby tlachání na yutubu…

SeznamBot vrací úder

1. January 2008

aneb legenda pokračuje. Připomeňme si nejdřív základní parametry našeho webu - web je česky, obsah stojí z principu zahovno (co byste ode mě čekali že), průměrně prolinkován, pár odkazů zvenku a celá ta sranda je o ~50k stránkách. Jak si momentálně u mě stojí chlapci z miliardových firem ?

3774 stránek Googlebot
740 stránek msnbot
175 stránek morfeo.centrum
24 stránek Yahoo! Slurp
9 stránek SeznamBot
5 stránek shelob v (WTF!?)

Efektní grafíky si protentokrát odpustím. Pokud bychom brali v potaz pouze “unikátní přístupy” na stránky tak morfeo končí tak 1 level od indexu, hlouběji nejde a to co má pravidelně obnovuje. Pak je tu náš local hero od Seznamu. Jestliže budeme chvilku zkoumat jeho chování, dojdeme k zajímavým závěrům.

První, že mi po stránkách pobíhají dva Seznamy…

SeznamBot/2.0 (+http://fulltext.seznam.cz/)
SeznamBot/2.0-test (+http://fulltext.sblog.cz/)

Že druhý z botů je mírně oprsklejší a už si místo “/” stáhnul i tři stránky okolo, což je sice potěšující, ale ne tolik. Zato můžu mít hřejivý pocit, že v nějaké budoucí produkční verzi se konečne do indexu dostanu :)

Co je horší, že ani jedna verze neumí stáhnout sitemap, ano vidíte správně neumí. Po skoro fantastickém spuštění podpory sitemap selhává boťák na úplném základu. Může v tom být záměr ? Požívat nedotáhnutá XMLka ?

“GET /sitemapGenerate HTTP/1.0″ 200 4389485 “-” “Wget/1.10.2″ (statická generace cca 4.3MB)
“GET /sitemap.xml HTTP/1.1″ 200 8192 “-” “SeznamBot/2.0 (+http://fulltext.seznam.cz/)” (stáhnuto 8kb)
“GET /sitemap.xml HTTP/1.1″ 200 4389485 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”
“GET /sitemap.xml HTTP/1.1″ 200 15609 “-” “SeznamBot/2.0-test (+http://fulltext.sblog.cz/)” (stáhnuto 15kb)

tedy - mohli bychom se hypoteticky domnívat, že za pár měsícu se dopracuje k celému fajlu, ovšem jestli to takhle někdo opravdu vymyslel, můžeme Seznamu vřele gratulovat ke skvělému vývojářskému týmu a hodně takových do nového roku ;)





© sh, bw and hosting donated by lidos.cz