كيفية الزحف إلى موقع كبير واستخراج البيانات باستخدام أداة تحسين محركات البحث لـ Screaming Frog

يصرخ الضفدع SEO العنكبوت

نحن نساعد العديد من العملاء في الوقت الحالي هجرات Marketo. نظرًا لأن الشركات الكبيرة تستخدم حلولًا مؤسسية مثل هذه ، فإنها تشبه شبكة العنكبوت التي تنسج نفسها في العمليات والأنظمة الأساسية على مدار سنوات ... حتى النقطة التي لا تدرك فيها الشركات كل نقطة اتصال.

باستخدام نظام أساسي لأتمتة التسويق المؤسسي مثل Marketo ، تعد النماذج نقطة دخول البيانات عبر المواقع والصفحات المقصودة. غالبًا ما يكون لدى الشركات آلاف الصفحات ومئات النماذج عبر مواقعها التي تحتاج إلى تعريف للتحديث.

أداة عظيمة لهذا صراخ الضفدع كبار المسئولين الاقتصاديين العنكبوت... ربما يكون النظام الأساسي الأكثر شيوعًا في السوق للزحف والتدقيق واستخراج البيانات من أحد المواقع. النظام الأساسي غني بالميزات ويوفر مئات الخيارات لكل مهمة تحتاجها تقريبًا.

صراخ الضفدع العنكبوت SEO: الزحف واستخراج

الميزة الرئيسية لـ Screaming Frog SEO Spider هي أنه يمكنك إجراء عمليات الاستخراج المخصصة بناءً على رجإكس, كسباث، أو CSSPath تفاصيل. يأتي هذا مفيدًا للغاية لأننا نرغب في الزحف إلى مواقع العميل ومراجعة قيم MunchkinID و FormId والتقاطها من الصفحات.

باستخدام الأداة ، افتح التكوين> مخصص> استخراج لتحديد العناصر التي ترغب في استخراجها.

screamingfrog استخراج مخصص

تسمح شاشة الاستخراج بجمع بيانات غير محدود تقريبًا:

صراخ الضفدع كبار المسئولين الاقتصاديين قواعد استخراج العنكبوت

استخراج Regex و XPath و CSSPath

بالنسبة إلى MunchkinID ، يوجد المعرف داخل البرنامج النصي للنموذج الموجود داخل الصفحة:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

ثم نطبق أ حكم Regex لالتقاط المعرف من داخل علامة البرنامج النصي التي تم إدراجها في الصفحة:

Regex: ["']id["']: *["'](.*?)["']

بالنسبة لمعرف النموذج ، تكون البيانات في علامة إدخال داخل نموذج Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

نحن نطبق حكم XPath لالتقاط المعرف من داخل النموذج الذي تم إدراجه في الصفحة. يبحث استعلام XPath عن نموذج بإدخال باسم هائل، ثم يحفظ الاستخراج ملف القيمة:

XPath: //form/input[@name="formid"]/@value

صراخ الضفدع سيو العنكبوت تقديم جافا سكريبت

خيار آخر رائع لـ Screaming Frog هو أنك لست مقيدًا بـ HTML في الصفحة ، يمكنك عرض أي JavaScript يقوم بإدراج النماذج داخل موقعك. في غضون التكوين> العنكبوت، يمكنك الانتقال إلى علامة التبويب "العرض" وتمكين هذا.

صراخ الضفدع سيو العنكبوت تقديم جافا سكريبت

يستغرق هذا وقتًا أطول قليلاً للزحف إلى الموقع ، بالطبع ، ولكن ستحصل على نماذج يتم عرضها من جانب العميل بواسطة JavaScript بالإضافة إلى النماذج المدرجة من جانب الخادم.

على الرغم من أن هذا تطبيق محدد للغاية ، إلا أنه مفيد بشكل لا يصدق لأنك تعمل مع مواقع كبيرة. سترغب تمامًا في تدقيق مكان تضمين نماذجك في جميع أنحاء الموقع.

تحميل Screaming Frog SEO Spider

ما رأيك؟

يستخدم هذا الموقع نظام Akismet لتقليل الرسائل الضارة. تعرف كيف تتم معالجة بيانات تعليقك.