Portal > Foren > PHP > PHP-Programmierung > Externe Seiten Crawlen und Inhalt speichern
Antwort
 
Themen-Optionen
Alt 06.06.2007, 21:05 Nach oben    #1
Erfahrener Benutzer
 
Registriert seit: 04.03.2007
Ort: Viernheim
Beiträge: 131
Standard Externe Seiten Crawlen und Inhalt speichern

Hallo erneut
Ich möchte von einer Seite bestimmte Seiten mittels PHP Crawlen und
deren Inhalt speichern. Der soll auto. den Links folgen

Eigentlich baut diese Frage auf meine vorrige Frage auf
@Ben weiß mehr *gg

Danke im vorraus.


Eyüp
Eyüp ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 06.06.2007, 23:56 Nach oben    #2
Ben
Benjamin Klaile
 
Benutzerbild von Ben
 
Registriert seit: 02.12.2004
Ort: Remagen
Beiträge: 4.480
Standard

Nu, du müsstest dir die Startseite vornehmen, dort alle Links raussuchen, dann alle diese Seiten, die verlinkt sind, wiederum anspringen und so weiter und so fort.

Ist halt eine rekursive Sache. Kannst dir ja mal das Tutorial anschauen.
Ben ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 07.06.2007, 03:58 Nach oben    #3
Benjamin Steininger
 
Benutzerbild von robo47
 
Registriert seit: 02.06.2005
Ort: weiher im tiefsten Odenwald
Beiträge: 1.180
Standard

gehts hier darum mal eben eine seite etwas zu crawlen, oder eine art crawler für eine suchmaschine ?

mal eben ein paar seiten crawlen ist noch machbar, aber wirklich als crawler würde ich es nicht einsetzen, habe das selbst schonmal versucht .... wenn du es wirklich vorhast, lass es nach möglichkeit nicht über den browser laufen sondern direkt über die php-binary, hat bei mir die leistung damals mehr als verdoppelt.
robo47 ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 07.06.2007, 08:59 Nach oben    #4
Erfahrener Benutzer
 
Registriert seit: 04.03.2007
Ort: Viernheim
Beiträge: 131
Standard

Zitat:
Zitat von robo47 Beitrag anzeigen
gehts hier darum mal eben eine seite etwas zu crawlen, oder eine art crawler für eine suchmaschine ?

mal eben ein paar seiten crawlen ist noch machbar, aber wirklich als crawler würde ich es nicht einsetzen, habe das selbst schonmal versucht .... wenn du es wirklich vorhast, lass es nach möglichkeit nicht über den browser laufen sondern direkt über die php-binary, hat bei mir die leistung damals mehr als verdoppelt.
Hi, es geht einfachd arum, die seite so zu crawlen, einmalig.

Wie meinst du das, über php-binary?
Eyüp ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 07.06.2007, 09:41 Nach oben    #5
Benjamin Steininger
 
Benutzerbild von robo47
 
Registriert seit: 02.06.2005
Ort: weiher im tiefsten Odenwald
Beiträge: 1.180
Standard

nicht über den webserver das script starten sondern unter windows über die php-cgi.exe unter linux unter der cgi-binary
robo47 ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus


Alle Zeitangaben in WEZ +2. Es ist jetzt 13:04 Uhr.


Powered by vBulletin® Version 3.7.3 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44