Kako indeksirati veliko web mjesto i izvući podatke pomoću vrištećeg žabljeg SEO Spider-a

Screaming Frog SEO Spider
Vrijeme za čitanje: 3 zapisnik

Trenutno pomažemo nekoliko klijenata Marketo migracije. Kako velike tvrtke koriste ovakva poslovna rješenja, to je poput paukove mreže koja se godinama utka u procese i platforme ... sve dotle da tvrtke nisu ni svjesne svake dodirne točke.

Uz platformu za automatizaciju marketinškog marketinga kao što je Marketo, obrasci su početna točka podataka na web lokacijama i odredišnim stranicama. Tvrtke na svojim web mjestima često imaju tisuće stranica i stotine obrazaca koje treba identificirati za ažuriranje.

Sjajan alat za to je Vrišteći žaba SEO Spider... možda najpopularnija platforma na tržištu za indeksiranje, reviziju i izdvajanje podataka s web mjesta. Platforma je bogata značajkama i nudi stotine mogućnosti za gotovo svaki vaš zadatak.

Vrišteći žabac SEO Spider: puzanje i ekstrakt

Ključna značajka Screaming Frog SEO Spider je da možete izvoditi prilagođena izvlačenja na temelju Regularni izraz, XPath, ili CSSPath specifičnosti. Ovo je izuzetno korisno jer želimo pretražiti i indeksirati klijentove web stranice te revidirati i zabilježiti vrijednosti MunchkinID i FormId sa stranica.

Otvorite alat Konfiguracija> Prilagođeno> Izdvajanje za prepoznavanje elemenata koje želite izvući.

vrištanje žabe prilagođeno vađenje

Zaslon za izdvajanje omogućuje gotovo neograničeno prikupljanje podataka:

Pravila izvlačenja pauka koja vrište od žaba

Ekstrakcija regularnih izraza, XPath i CSSPath

Za MunchkinID identifikator se nalazi unutar skripte obrasca koja se nalazi na stranici:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Zatim primjenjujemo a Regex pravilo za hvatanje ID-a unutar oznake skripte koja je umetnuta na stranicu:

Regex: ["']id["']: *["'](.*?)["']

Za ID obrasca podaci su u ulaznoj oznaci unutar obrasca Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Primjenjujemo Pravilo XPath za hvatanje ID-a iz obrasca koji je umetnut na stranicu. Upit XPath traži obrazac s ulazom s imenom grozan, zatim ekstrakcija sprema vrijednost:

XPath: //form/input[@name="formid"]/@value

Vriskanje žabe SEO Spider Javascript prikazivanje

Još jedna izvrsna opcija Screaming Frog je ta što niste ograničeni na HTML na stranici, možete prikazati bilo koji JavaScript koji će umetnuti obrasce na vaše web mjesto. Unutar Konfiguracija> Pauk, možete otići na karticu Renderiranje i omogućiti ovo.

Vriskanje žabe SEO Spider Javascript prikazivanje

Za to je potrebno malo više vremena za indeksiranje web stranice, ali dobit ćete obrasce koje JavaScript prikazuje na strani klijenta, kao i obrasce koji su umetnuti na strani poslužitelja.

Iako je ovo vrlo specifična aplikacija, nevjerojatno je korisna dok radite s velikim web mjestima. Apsolutno ćete htjeti revidirati gdje su vaši obrasci ugrađeni u cijelu web lokaciju.

Preuzmite SEO Spider Screaming Frog

Što vi mislite?

Ova web stranica koristi Akismet za smanjenje neželjene pošte. Saznajte kako se podaci vašeg komentara obrađuju.