Get Started

به نشونک خوش آمدید! نشونک سرویس حرفه ای استخراج نیمه اتوماتیک اطلاعات از صفحات وب می باشد. نشونک هرآنچه که برای استخراج و بازبابی اطلاعات از صفحات وب نیاز دارید را در اختیارتان قرار می دهد. داده های استخراج شده مستقیما در کامپیوتر کاربر نهایی ذخیره می گردد بنابراین خدماتی نظیر ذخیره سازی، نگهداری و یکپارچه سازی اطلاعات در نشونک ارائه نمی گردد. اگر قصد استخراج مستقیم اطلاعات از صفحات آنلاین وب و ذخیره آن برروی کامیپوتر و یا وب سایت تان را دارید، نشونک می تواند بهترین سرویس را به شما ارائه نماید.


گام های استخراج

اولین گام شناسایی منبع داده است. باید مشخص نمایید داده های مورد نظر شما در کدام صفحه وب قرار دارد. دومین گام تعریف الگوی استخراج می باشد. الگوی استخراج به ازای یک گروه از صفحات وب مشابه، تعریف شده و اقلام اطلاعاتی قابل استخرج در هر صفحه را مشخص می کند. همچنین الگوهای استخراج مشخص می نماید موتور استخراج از کدام صفحات باید آغاز نموده و روش خزیدن بین صفحات را تعیین می کند. گام سوم اجرای نرم افزار Neshoonak.WebScaper و استخراج اطلاعات از بین صفحات وب می باشد.


روش کار Neshoonak.WebScraper

تصویر فوق گام های اجرای استخراج در نرم افزار Neshoonak.WebScraper را نشان می دهد. بلافاصله بعد از شروع فرایند استخراج، موتور استخراج ابتدا الگوهای آغازین را جستجو کرده و به صف استخراج اضافه می کند. به ازای هریک از صفحات موجود در این صف، بعد از دانلود صفحه مورد نظر، قواعد استخراج لیست ها اجرا شده و بعد از آن اسکریپت های صفحه اجرای می گردد.



  Loading...