Jak rozpoznać robota?
Zwykle pomocny w tym wypadku będzie nagłówek HTTP_USER_AGENT.Za pomocą tego nagłówka przeglądarka się identyfikuje.Można oczywiście zmienić taki nagłówek, ale większość botów tego nie robi.Polecam link do anglojęzycznego wpisu jak zablokować botom dostęp do strony.
Oczywiście obowiązkowo należy dać dostęp robotowi Google, Yahoo, Binga.
2 komentarzy:
Tak na dobrą sprawę należy przede wszystkim dobrze zdefiniować plik htaccess. Dzięki temu mamy pewność, że odwiedzać nas będą roboty i indeksować tylko te, który chcemy. Przy tworzeniu stron https://dolp.pl/strony-www może to mieć dość duże znaczenie.
Prześlij komentarz
Podziel się swoimi myślami.Spam nie będzie tolerowany.