Да намалим натоварването на хостинга с помощта на AwStats

Всеки хостинг има някакви ограничения. Ако ги превишите значително – ще ви помолят да си оптимизирате сайта или да преминете на по-висок план. Освен да си оптимизирате сайта, което е нещо много добро, можете да намалите натоварването и по друг начин и това е като блокирате някой-друг ненужен бот.

Малко хора знаят, че по-голямата част от посещенията на един сайт, обикновенно са от ботове, а не от хора. Така че, дори и да имате малко посещения според стандартните броячи, реално може да имате многократно повече, които идват от всякакви ботове. Тук идва на помощ AwStats статистиката, която можете да достъпите през вашия cPanel.

За разлика от нормалните броячи, тук са видими абсолютно всички посещения – било то от ботове, от хора от разните му там онлайн инструменти и сайтове и т.н. След като влезете в AwStats за даден сайт, скролнете до раздела Хостове, където е списъка с IP адреси. Там можете да видите или Пълен списък или Последни посещения. В единия вариант се подреждат по най-много посещения, а в другия по дата.

За всеки IP адрес виждате по колко Страници и колко Хита е направил, също колко килобайта/мегабайта информация е свалил и кога е посетил за последно. Лично мое наблюдение е че ботовете имат една и съща цифра за Хитове и Страници. Не знам дали при всички е така, но аз лично така ги разпознавам на бързо. Оглеждам се за IP адресите с най-високи стойности на посещенията и с еднакви две стойности.

Когато си харесате IP адрес, в който се съмнявате, можете като за начало да го прокарате през Google. Ако моментално ви излезе резултат от някой известен сайт със списъци на спам ботове (stopforumspam.com, projecthoneypot.org и т.н.), съвсем спокойно можете да блокирате този адрес. Блокирането става през cPanel-а на друго място, наречено по начин подобен на Филтриране на IP-адреси или Блокиране на IP-адреси.

Ако през Google не ви е много лесно да разберете дали този бот е лош и дали изобщо е бот или не, то е време да прибегнем до суровите логове (raw access logs). Това се достъпва отново от cPanel-а. За всеки сайт можете да откриете лог файл с последните посещения примерно за месеца (или както е там настроен). Изтеглете файла, разархивирайте, може да се наложи да го преименувате, така че да има разширение .txt и го отворете. Може да се наложи да прибегнете до този метод за отваряне на големи текстови файлове, понеже понякога стават доста огромни.

С find (ctrl + f) намерете IP адреса и вижте неговите данни. Тук може да се каже че ви трябват малко познания за да разберете кое какво е. Може да се образовате по въпроса като потърсите в гугъл за apache log format или нещо подобно. Изследвайки информацията тук можем да забележим разнообразни неща, като например че това IP влиза точно на всеки 2 часа всеки път или пък на всеки кръгъл час. Доста необичайно поведение дори и за най-организирания човек ;). Определено това е бот. Друго, което можем да видим е че се достъпва една и съща страница винаги примерно вашият RSS фийд. Тук ще става дума за някой RSS агрегатор може би. Понякога в user agent-а можете да видите и името и сайта на бота, но повечето нямат такава информация.

Отново като откриете някое лошо IP, което само ви товари, а не прави нищо полезно или ви спами с коментари по блога или форума ви, блокирайте го през контролния панел. Внимавайте да не блокирате Google или някоя друга търсячка или някой сайт, който ви помага по някакъв начин, примерно слага линкове към новите ви публикации като разбира за тях през RSS фийда ви.

Като заключение мога да кажа, че ако не използвах този метод, до сега да съм превишил с много някои мои хостинг акаунти, само заради някакви си ботове, агрегатори и тем подобни.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*