- http://www.robotstxt.org - The Web Robots Pages
- Robots.txt Einführung
Eine besondere Form von Webcrawlern sind software-Agenten, bei denen eine Menge von autonomen Programmen das Web gemeinsam durchsuchen.
Wie beim internetsurfen gelangt ein Webcrawler über Hyperlinks von einer Webseite zu weiteren URLs. Dabei werden alle bisher bekannten Adressen gespeichert und der Reihe nach besucht. Die neu gefundenen Hyperlinks werden zur Liste aller URLs hinzugefügt. Auf diese Weise können und werden auch als Spinnen bezeichnet, da sie sich wie diese in einem Netz fortbewegen.
Ein Webcrawler (auch Spider oder robot) ist ein Computerprogramm, das automatisch das World Wide Web durchsucht und webseiten analysiert. Webcrawler werden vor allem von Suchmaschinen eingesetzt. weitere Anwendungen sind beispielsweise das Sammeln von MailAdressen oder anderen informationen.
Je nach Aufgabe des Webcrawlers wird der Inhalt der gefundenen webseiten beispielsweise mittels Indexierung ausgewertet und gespeichert, um ein späteres suchen in den so gesammelten Daten zu ermöglichen. Dabei werden verschiedene Ranking-Algori und zur Untersuchung des internets (Webome) eingesetzt und müssen nicht zwangsläufig auf das WWW beschränkt sein. Ein Großteil des gesamten internets wird jedoch von Webcrawlern und damit auch mit bekannten Suchmaschinen nicht erfasst, da viele Inhalte nicht über einfache Links sondern beispielsweise nur über Suchmasken und zugangsbeschränkte portale erreichbar sind. Man spricht bei diesen Bereichen auch vom "Deep Web".
Übersicht Webkatalog - Mehr zum Thema Webcrawler (2)
informationen zu verwandten Kategorien:
Ranking
# telefonauskunft
# Kommunikation
# 1905
# history marketing
# URL
# Englische Sprache in der Werbung
Wikibooks
# Synonym
# Jeep
# Psychologie
# Kontrahierungspolitik
# Leukoplast
# RundfunkWerbung
Corporate Identity
# Marktforschung
# design
# Mode
# LKW
# Konkurrenz
# Manfred Bruhn
Semantisches Web
# Lebensstil
# Suchbegriffe
# Druckversion
# Suggestion
# Uniform Resource Locator
# prozessziel
Gopher
# Konfliktsoziologie
# Javascript
# Art Director
# Non-Profit marketing
# Themen
# Wahrnehmungspsychologie
Alkohol
# Festplatte
# Kunstwort
# Datenstruktur
# Dienstleistung
# Lars Clausen
# NeXT
Clienting
# MetaSuchmaschine
# Agitation
# Microsoft network
# Begriffsmonopol
# Kuoni
# Jugend
Datenbank
# Pick Pay
# BetriebsWirtschaft
# TrikotWerbung
# Liste von WebVerzeichnissen
# Alltours
# Dienstleistungsmarketing
Xerox
# Suchmaschine
# information
# Deep Web
# Extensible Hypertext Markup Language
# Open Directory Project
# Preispolitik
Penetration
# Koordination
# Suchmaschineneintrag
# Wolfgang Hilke
# Wert
# Corporate Communication
# Creative Director
Umgangssprache
# direktWerbung
# Diversifikation
# Soziale Gruppe
# unternehmensberater
# Zielformulierung
# Suchverfahren
Client-server-Prinzip
# Open Archives Initiative
# Konsumenten
# datenschutz
# 2003
# Marktanteil
# Spalt-Tablette
Rundfunkstaatsvertrag
# Branding
# Ware
# Platzierung
# Cross Selling
# domain
# Industrielle Revolution
FernsehWerbung
# KinoWerbung
# Common Gateway Interface
# Cascading Style Sheets
# Distributionslogistik
# 13. november
# Suchmaschinen-Spamming
Horizontale Integration
# Volker Trommsdorff
# Webtemplate
# Dateiformat
# Bekanntheitsgrad
# ZielGruppe
# Meinungsforschung
Erich Gutenberg
# Mitbewerber
# Suchmaschinen
# Charterflug
# Rabattmarke
# Web Mining
# Rufnummer
Ad hoc
# reiseveranstalter
# Fremdenverkehr
# Absatz
# Plakat
# VolksWirtschaftslehre
# World Wide Web
Heribert Meffert
# Vertikale Integration
# Kontrolle
# Massachusetts Institute of Technology
# Produktpolitik
# Webbrowser
# Deutscher Werberat
Incoming-Agentur
# Adbusting
# marketing nach innen
# Web Impact Faktor
# Palo Alto
# Handeln
# Controlling
Archie
# BetriebsWirtschaftslehre
# Wikisource
# Ganzreklame
# Olfaktorische Wahrnehmung
# SchleichWerbung
# Larry Page
Willen
# Recherche
# .NET
# Webserver
# Datenbankindex
# REWE-Zentral AG
# Ferrero
Hierarchie
# Hubs und Authorities
# Kaizen
# 1990
# Brand Management
# 1939
# prozess
Geld
# 2001
# Markenartikel
# Hotel
# Wiktionary
# Fluggesellschaft
# Mission
Yahoo
# Unterschwellige Werbung
# AOL
# AltaVista
# Robinsonliste
# Radio
# category Management
Gesetz gegen den unlauteren Wettbewerb
# 11. september
# Teledienstegesetz
# RadioWerbung
# Hochbau
# WebVerzeichnis
# Akteur
marketing
# Speichermedium
# Synergie
# Katalog
# Webportal
# Webkatalog
# Propaganda
Freiwillige selbstkontrolle
# Sergey Brin
# Verkauf
# PHP
# Kommunikationspolitik
# Marktsegmentierung
# Kontinuierlicher Verbesserungsprozess
World Wide Web Consortium
# Vektorraum-Retrieval
# Japan
# Thomas Cook AG
# Deckungsbeitrag
# robert Cailliau
# Grafiker
Balanced Scorecard
# Preistheorie
# Werbekonzept
# Suchmaschinen-Optimierung
# Markt
# Aufmerksamkeit
# Werbespot
Schnitzelmitkartoffelsalat
# Taxonomie
# Werbespot-Produktionskosten
# PageRank
# Jerry Yang
# 2005
# Produktgestaltung
Verzeichnis
# Markentreue
# linklisten
# Telemediengesetz
# Berlin
# Inverssuche
# Portable document Format
Katalogisierung
# MarktWirtschaft
# Channel marketing
# Ferienwohnung
# FAQ
# Deutschland
# Distributionspolitik
Condor
# University of Minnesota
# eintragen
# Fotograf
# Stackelberg
# Image
# reiseplanung
Die Zeit
# StreuWerbung
# Algorithmus
# google-Bombe
# Walkman
# internetWerbung
# Public Relations
Empfehlungsmarketing
# Computer
# HTML
# David Filo
# Corporate design
# Bibliothek
# Relaunch
Data Mining
# Hotelplan
# information-Retrieval
# Corporate Behaviour
# Deutsche Bundespost
# Microsoft
# Spezialisierung
marketing-Mix
# VerkehrsmittelWerbung
# Linkfarm
# Rundfunk
# telefonWerbung
# Pillar
# wissenschaft
Vampireffekt
# Webseite
# 2004
# Warnung
# Soziales Milieu
# google
# webpromotion
Hyperlink
# Pompeji
# Gestaltpsychologie
# website
# Poster
# Stanford University
# J2EE
Client
# Wirtschaftliches Gut
# Webanwendung
# metatags
# webseiten
# Guerilla-marketing
# Teledienst
Liste der Begriffsmonopole
# Bundesrepublik
# Newsgroup
# Sex sells
# Dateisystem
# Christian Homburg
# Korruption
Soziologie
# Vermarktung
# Kostenrechnung
# Heiratsvermittlung
# Tesafilm
# Heinrich Freiherr von Stackelberg
# Vertriebwesen
Anzeige
# Kind
# Tim Berners-Lee
# Dokument
# Very Easy Rodent-Oriented Netwide Index to Computerized Archives
# Webdesigner
# Redundant
Lektor
# MetaGer
# Webcrawler
# Virales marketing
# 2002
# Datenverkehr
# Ergebnisziel
Jugendschutz
# Webdesign
# Werbefotografie
# Kunst
# Hotelkette
# Multimedia
# Rangfolge
internet
# Werbung
# Mediendienst
# Nutella
# MegaSuchmaschinen
# Backpulver
# Jugendmedienschutz-Staatsvertrag
Publizistik
# Philip Kotler
# suchdienste
# Annonce
# Slogan
# Motivation
# Telemedien
Stemming
# Rechnernetz
# Couponing
# Antwortzeit
# Relevanz
# Logistik
# Nutch
6. oktober
# Fernsehen
# Soziale Sanktion
# 1920
# Vertriebspolitik
# Ziel
# Mediendienste-Staatsvertrag
EG-Fernsehrichtlinie
# Business-Suchmaschine
# Sozialer Status
# Computerprogramm
# Fast Moving Consumer Goods
# Politologie
# Customer Relationship Management
Lycos
# Planung
# Hypertext
# Intranet
# Marktkommunikation
# |