Du bist nicht angemeldet. Der Zugriff auf einige Boards wurde daher deaktiviert.

#1 04. Oktober 2011 12:12

faglork
arbeitet mit CMS/ms
Ort: Fränkische Schweiz
Registriert: 15. Dezember 2010
Beiträge: 1.152
Webseite

Statics: Fragen zum Browsersniffer / Robots

Moin!

Sehe ich das richtig:

  function IsRobot($extrarobots="") {     
$robots = $this->robots;     
if ($extrarobots != "") {
       $robots = array_merge($robots, explode(";", $extrarobots));
     }
     foreach ($robots as $id) {       
          if (preg_match("/" . $id . "/i", $this->useragent)) {
         $this->robot = $id;
         return true;
       }
     }
     return false;
   }

arbeitet das Array

  var $robots = array(
       "msnbot",
       "cuill",
       "crawl",
       "search",
       "exabot",
       "msn",
       "googlebot",
       "yahoo",
       "jeeves",
       "bingbot",
       "yandex",
       "Sosospider",
       "Java"
   );

der Reihe nach ab und nimmt den ersten den er findet. Oder?

Dann taucht Yahoo meist nicht auf, weil es unter "search" schon abgefangen wird: der UA ist ja
Mozilla/5.0 (compatible; Yahoo! Slurp; htt p:/ /help.yahoo.com/help/us/ysearch/slurp)

Seh ich das richtig?
Dadurch ergibt sich eine völlige Verzerrung. Auch Baidu und MSN Media haben "search" im UA.

Das hieße das dieses Array gründlich überholt werden muss.

Dann habe ich noch ein Problem mit einem Robot "crawl", welcher der zweithäufigste Robot sein soll.
WEBALIZER sieht da nur
magpie-crawler/1.1 (U; Linux amd64; en-GB; +http://www.brandwatch.net)
UnisterBot (Mozilla/5.0 compatible; crawler@unister-gmbh.de)

beides völlig uninteressant. Hat überhaupt irgendeiner der wichtigen bots den String "crawl" im UA?


Auch bei den Browsern ist das Ergebnis eigenartig. Top-IE-Version wäre demnach 6.0, was wohl ein schlechter Witz ist ...

Servus,
Alex

Beitrag geändert von faglork (04. Oktober 2011 12:16)

Offline

#2 05. Oktober 2011 17:03

Andynium
Moderator
Ort: Dohna / SN / Deutschland
Registriert: 13. September 2010
Beiträge: 7.018
Webseite

Re: Statics: Fragen zum Browsersniffer / Robots

faglork schrieb:

Das hieße das dieses Array gründlich überholt werden muss.

Klingt nach Feature-Request wink.

Offline