لیست ها

لیست ها را می توان در برگه properties الگوی استخراج مشاهده، ویرایش و یا تست نمود. همانند یک صفحه اکسل، لیستها داری ستون و ردیف می باشند. هر لیست به مجموعه ای از یک یا چند ردیف اشاره می کند که در فرم ویرایش لیست با Row Selector مشخص می گردد. موتور استخراج نشونک به ازای هریک از ردیف های اشاره شده در Row Selector ستون های مرتبط را استخراج می کند. عدم تنظیم Row Selector سبب استخراج تنها یک ردیف از اطلاعات مورد نظر خواهد شد.


فرم ویرایش لیست

لیست ها در موارد زیر کاربرد دارند:



لیست ها به تنهایی می توانند آغازگر استخراج از صفحات دیگر باشند. بدین منظور، باید در فرم ویرایش لیست، تنظیمات زیر صورت پذیرد:

  • در بخش link to الگوی استخراج مرتبط را انتخاب نمایید
  • نتیجه اجرای Row Selector باید "آدرس" صفحات مورد نظر جهت استخراج باشد.

ذخیره محتویات یک آدرس وب برروی کامپیوتر

می توانید به شیوه زیر، لیست ها را بگونه ای تنظیم نمایید که موتور استخراج نشونک اطلاعات مجموعه ای از Url ها را دانلود کرده و برروی کامپیوتر کاربر نهایی ذخیره نماید.

  • در بخش link to الگوی استخراج مرتبط را انتخاب نمایید
  • نتیجه اجرای Row Selector باید "آدرس" صفحات مورد نظر جهت استخراج باشد.

ستون ها نیز همانند لیست ها می توانند به تنهایی آغازگر استخراج از صفحات دیگر باشند. بدین منظور، باید در فرم ویرایش ستون تنظیمات زیر صورت پذیرد:

  • در بخش link to الگوی استخراج مرتبط را انتخاب نمایید
  • نتیجه اجرای Value Selector باید "آدرس" صفحات مورد نظر جهت استخراج باشد.

استخراج اطلاعات موجود در صفحات وب

پرکاربرد ترین مورد استفاده لیست ها، استخراج اطلاعات از صفحات وب می باشد. Row Selector ردیف های لیست را مشخص می کند. به ازای هر ردیف، ستون های لیست پردازش می گردند و مقدار مشخص شده توسط Value Selector از صفحه وب استخراج می گردد.


ستون های داینامیک

یکی از جذابترین قابلیتهای لیست، تولید ستونها بصورت دینامیک می باشد. بدین معنی که نام ستون هنگام طراحی الگوی استخراج مشخص نیست و درهنگام اجرای WebScraper مشخص می گردد. در این حالت نام ستون از اطلاعات موجود در صفحه وب استخراج می گردد. بدین منظور باید تنظیمات زیر صورت گیرد:

  • یک ستون جدید با نام .include ایجاد نمایید
  • در فرم ویرایش ستون، سه سلکتور زیر را تنظیم نمایید:
    • Row Selector: این سلکتور، المان هایی که شامل نام و مقدار ستونهای لیست می باشند را مشخص می کند
    • Name Selector: این سلکتور نام ستون را تعیین می کند
    • Value Selector: این سلکتور مقدار ستون را مشخص می کند


  Loading...