Content-Typ-Filter

In BotScope kannst du die Anfragen der Crawler nach Format filtern. Der Content-Typ-Filter klassifiziert jeden aufgerufenen Pfad automatisch anhand der Dateiendung in folgende Typen: 🖼️ Bild — .jpg, .jpeg, .png, .webp, .gif, .svg, .ico, .avif u. a. 🎨 CSS — Stylesheets (.css) ⚙️ JavaScript — .js, .jsx, .mjs 🔤 Font — .woff, .woff2, .ttf, .eot, .otf 🎬 Media — .mp4, .webm, .mp3, .wav, .ogg, .mkv u. a. 📊 Data — .json, .xml, .rss, .atom, .csv 📝 Text — .txt, .log, .md, .ini, .cfg, .yaml, .yml, .nfo 📄 Dokument — .php, .html, .pdf, .asp, .jsp und alle nicht erkannten Pfade (Slugs, bare URLs) Verwendung: • Klicke auf einen Content-Typ-Badge in der Filter-Leiste um nur Anfragen dieses Typs anzuzeigen. • Kombiniere Content-Typ mit anderen Filtern (z. B. nur Bilder vom Googlebot). • Im Chart werden die gefilterten Anfragen sofort neu berechnet.

Die Content-Typ–Filter beantworten dir folgende operativen Fragen:

Wann und wie oft wird eine robots.txt abgerufen - der Text-Filter grenzt die Ansicht schnell und effizient ein.
Wie oft und wann kommt Google, um sich die Sitemap.xml zu holen - im Content-Typ: Data
Bei Bild-Indexierungsproblemen - holt sich Google die webp oder doch die jpg Variante deines Bildes?
Wann genau kommt Google und holt sich das Bild zum passenden Beitrag - denn erst wenn das Bild indexiert wurde, erscheint z.B. das Rezept in der Rezeptgalerie
Wie oft beschäftigt sich der Crawler mit deinen .pdf Datein, sollten diese überhaupt indexierbar sein?
Gibt es ggf. Zugriff auf sicherheitsrelevante Datein .bak oder .conf oder andere Datein die versehentlich abrufbar sind und sensible Daten beinhalten?