Yahoo Clever wird am 4. Mai 2021 (Eastern Time, Zeitzone US-Ostküste) eingestellt. Ab dem 20. April 2021 (Eastern Time) ist die Website von Yahoo Clever nur noch im reinen Lesemodus verfügbar. Andere Yahoo Produkte oder Dienste oder Ihr Yahoo Account sind von diesen Änderungen nicht betroffen. Auf dieser Hilfeseite finden Sie weitere Informationen zur Einstellung von Yahoo Clever und dazu, wie Sie Ihre Daten herunterladen.
IDs einer URL nach Stichwort absuchen?
Hallo zusammen,
ich suche ein Programm, eine Seite oder eine andere Methode um fortlaufende IDs in einer URL nach einem Stichwort abzusuchen.
Ein kleines Beispiel, damit ihr versteht was ich meine:
Seite XY (www.xy.de) hat mehrere Artikel unter den Sub-URLs
www.xy.de/artikel?id=1
www.xy.de/artikel?id=2 usw. laufen.
In einem dieser Artikel ist das Stichwort "Desoxyribose" zu finden.
Ich suche nun eine Methode mit der ich z.B. die IDs 1-100 nach diesem Stichwort absuchen kann.
(Google ist keine Option).
Kennt ihr da etwas?
Vielen Dank im Vorraus,
cougR
Danke, Jens, für die Antwort.
Das ganze hört sich für mich dennoch recht kompliziert an, weil ich auch von Programmierung recht wenig Ahnung habe.
Die Windows-Suche erledigt sich für mich eh, da ich einen Mac habe *g* Aber da gibts ja auch entsprechende Optionen.
Allerdings habe ich Bedenken, wie groß das ganze werden wird. Es geht hier nämlich nicht nur um 100, sondern eher 1000 oder mehr Seiten.
1 Antwort
- jens 53121Lv 6vor 1 JahrzehntBeste Antwort
Offline browsen
Such dir nen Offline Browser, son Browser lädt dir alle Seiten einer Hauptdomain runter und speichert das als HTML Datein. Selbst erstellst du dir ne kleine Offline Page mit nem einzigen Iframe und ziehst dir da immer die index der runtergeladenen Page rein. Mit http://www.microsoft.com/windows/desktopsearch/de/... suchst du dann nur in diesen Datein/Ordnern
hört sich kompliziert an, ist es aber nicht. Jeder Browser lädt immer ganze Pakete, angezeigt wird aber nur die aufgerufene Url, es finden also im Hintergrund Downloads statt die man nicht bemerkt und die im Cache zwischen gespeichert werden. Statt temporärer Zwischenspeicherung zieht man sich das eben direkt in verschiedene Ordner und kann dann über die Desktopsuche weiterschauen. Direkten Sinn macht das aber auch nur wenn die Seiten mit nem CMS erstellt wurden, nur in CMS gibts diese Session IDs der fortlaufenden Nummerierung