Best of BlackHat SEO (3) - Generování obsahu (Markov)
13. November 2006
Se zjištěním, že google velice příznivě boduje rozsáhlé weby bylo celkém jasné kam blackhat trendy budou směřovat. V dnešní době je celkem běžné generovat weby, které mají v řádu tisíce unikátních stránek. Osobně mám takový pocit že se už od googlu nějaká opatření konala…ale zatím ne tak markantní na to aby se to nevyplatilo dělat. Osobně teď dělám pokus na několika doménách třetího řádu, protože jak zaznělo poměrně jasně od českého “Matta Cuttse” Seznamu, zatím situace okolo domén třetího řádu není dostatečně vyřešená.
Pokračování…
Seznam Lištička = Lukačovič is watching !?
6. November 2006
V době kdy začali vyhledávače vydávat kdejaký lišty do browserů mi bylo nebylo úplně jasné k čemu je veškerá ta snaha. Reklamy(až na vlastní produkt - vyhledávač) neobsahují, tak nač programovat něco co vám celkem zbytečně zabere dalších pár pixelů z vašeho drahoceného monitoru ? Podle mě jsou tu dvě odpovědi, částečně si nadbytečným políčkem vyhledávání připoutáte některé uživatele. Ta druhá a podle mě důležitější, že můžete sledovat co uživatelé lišty dělají.
Pokračování…
Spamuju, spamuješ, spamujeme blog.cz :)
19. October 2006
Ani nevim co mě k tomu vede, možná nuda v cz :) Možná touha ukázat něco konečně ‘užitečnýho’, každopádně tím nechci nikoho poškodit, tahle botka je pro mě vzásadě k ničemu. O cz se nezajímam od doby kdy jsem zjistil že na webu jdou vydělat peníze, v čr si malým webem bez podovdů nevyděláte ani na jídlo. Vyhledávače jako seznam, centrum a atlas jsou mi tak jako tak ukradený, protože vyhledávat je to poslední co umí dobře a efektivně. Ani nenabádam nikoho aby tohle používal a někomu ‘ničil’ blog, prostě užívejte pro studijní účely :)
Pokračování…
Další info ke cloakingu
12. October 2006
Pár blogspotů zpět jsem psal o tom jak rozpoznat crawlery a ruzné botky. A teď jsem dokonce narazil na oficiální vyjádření k problému opačnému, ale i tak je to info velice užitečné http://googlewebmastercentral.blogspot.com/2006/09/how-to-verify-googlebot.html. Takže by se k našim technikám určitě hodilo přidat rozpoznávání podle reverzního DNS záznamu.
V PHP to pak vypada asi takhle
<?php
function is_google($ip) {
$bot = 'googlebot.com';
$name = gethostbyaddr($ip);
return (strpos($name, $bot) !== false and gethostbyname($name) == $ip) ? true : false;
}
$ip = '66.249.66.1';
if (is_google($ip)) echo 'ahoj botaku';
?>
Jinak rozhodne neni na skodu si prolezt vsechny google blogy, lecos se dovite :)
Who needs Google API ? Google and Live spider is here :)
8. October 2006
If you are guestbook spammers or some blackhat seo warrior, i am sure that you became to problem how to search your targets. After overusing Google API with strange words i became banned. Only way was script which parse a results directly from website. So here are two which i created in Perl, one for Google, second for Live.com. But be carefull, google bans for overusing webinterface too, so pls use some proxies, i read stories about blocking C class subnet for one month.
Rename all files in directory to lowercase
6. October 2006
for f in *; do
g=`expr "xxx$f" : 'xxx\(.*\)' | tr '[A-Z]' '[a-z]'`
mv "$f" "$g"
done
Better using SQL (PHP)
2. October 2006
There are three forms of using INSERT (mysql manual). I would like to show that form with ‘… SET col_name=”something” …’ is better than others.
public function save() {
global $CONFIG;
if(!empty($this->id)) $sql = 'UPDATE `'.$CONFIG['table-users'].'` SET ';
else $sql = 'INSERT INTO `'.$CONFIG['table-users'].'` SET ';
$sql .='login=\''.mysql_real_escape_string($this->login).'\', ';
$sql .='pass=\''.mysql_real_escape_string($this->pass).'\' ';
if(!empty($this->id)) $sql .= 'WHERE id='.intval($this->id);
print $sql;
}
This way you can do update and insert in one function. Whole thing works on column ‘id’ which is primar key and auto_increment in db, its recieved after row is inserted so we can decide if object is new or if it has row in table by having or not having id.
