آنی پیپر
دانلود فایل‌های آموزشی دانش‌آموزی و دانشجویی

تحقیق مقاله همه چیز درباره موتور های جستجو گر در جهان

تعداد صفحات: 46 فرمت فایل: word کد فایل: 2863
سال: مشخص نشده مقطع: مشخص نشده دسته بندی: تحقیق مقاله مهندسی کامپیوتر

قیمت قدیم:۷,۶۰۰ تومان

قیمت: ۴,۶۰۰ تومان

دانلود فایل

کلمات کلیدی: اسپایدر - پایگاه داده - گوگل - موتور جستجوگر

خلاصه
فهرست و منابع

خلاصه تحقیق مقاله همه چیز درباره موتور های جستجو گر در جهان

موتورهای جستجو چگونه کار می کنند؟

وقتی جستجویی در یک موتور جستجوگر انجام و نتایج جستجو ارایه می شود، کاربران در واقع نتیجه کار بخش های متفاوت موتور جستجوگر را می بینند. موتور جستجوگر قبلا" پایگاه داده اش را آماده کرده است و این گونه نیست که درست در همان لحظه جستجو، تمام وب را بگردد. بسیاری از خود می پرسند که چگونه ممکن است گوگل در کمتر از یک ثانیه تمام سایت های وب را بگردد و میلیون ها صفحه را در نتایج جستجوی خود ارایه کند؟

گوگل و هیچ موتور جستجوگر دیگری توانایی انجام این کار را ندارند. همه آنها در زمان پاسخ گویی به جستجوهای کاربران، تنها در پایگاه داده ای که در اختیار دارند به جستجو می پردازند و نه در وب! موتور جستجوگر به کمک بخش های متفاوت خود، اطلاعات مورد نیاز را قبلا" جمع آوری، تجزیه و تحلیل می کند، آنرا در پایگاه داده اش ذخیره می نماید و به هنگام جستجوی کاربر تنها در همین پایگاه داده می گردد. بخش های مجزای یک موتور جستجوگر عبارتند از:

Spider یا عنکبوت

Crawler یا خزنده

Indexer یا بایگانی کننده

Database یا پایگاه داده

Ranker یا سیستم رتبه بندی

الف Spider- (عنکبوت)

اسپایدر یا روبوت (Robot)، نرم افزاری است که کار جمع آوری اطلاعات مورد نیاز یک موتور جستجوگر را بر عهده دارد. اسپایدر به صفحات مختلف سر می زند، محتوای آنها را می خواند، لینکها را دنبال می کند، اطلاعات مورد نیاز را جمع آوری می کند و آنرا در اختیار سایر بخش های موتور جستجوگر قرار می دهد. کار یک اسپایدر، بسیار شبیه کار کاربران وب است. همانطور که کاربران، صفحات مختلف را بازدید می کنند، اسپایدر هم درست این کار را انجام می دهد با این تفاوت که اسپایدر کدهای HTML صفحات را می بیند اما کاربران نتیجه حاصل از کنار هم قرار گرفتن این کدها را.

اما یک اسپایدر آنرا چگونه می بیند؟

برای این که شما هم بتوانید دنیای وب را از دیدگاه یک اسپایدر ببینید، کافی است که کدهای HTML صفحات را مشاهده کنید.برای این کار به شکلهای زیر نگاه کنید.

اسپایدر، به هنگام مشاهده صفحات، بر روی سرورها رد پا برجای می گذارد. شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آن را داشته باشید، می توانید مشخص کنید که اسپایدر کدام یک از موتورهای جستجوگر صفحات سایت را مورد بازدید قرار داده است

اسپایدرها کاربردهای دیگری نیز دارند، به عنوان مثال عده ای از آنها به سایت های مختلف مراجعه می کنند و فقط به بررسی فعال بودن لینک های آنها می پردازند و یا به دنبال آدرس ایمیل (Email) می گردند.

ب- Crawler (خزنده)

کراولر، نرم افزاری است که به عنوان یک فرمانده برای اسپایدر عمل می کند. آن مشخص می کند که اسپایدر کدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم می گیرد که کدام یک از لینک های صفحه ای که اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. ممکن است همه آنها را دنبال کند، بعضی ها را دنبال کند و یا هیچ کدام را دنبال نکند.

کراولر، ممکن است قبلا" برنامه ریزی شده باشد که آدرس های خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال کردن لینک های یک صفحه به این بستگی دارد که موتور جستجوگر چه حجمی از اطلاعات یک سایت را می تواند (می خواهد) در پایگاه داده اش ذخیره کند. همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جستجوگر داده نشده باشد.

شما به عنوان دارنده سایت، همان طور که دوست دارید موتورهای جستجوگر اطلاعات سایت شما را با خود ببرند، می توانید آنها را از بعضی صفحات سایت تان دور کنید و اجازه دسترسی به محتوای آن صفحات را به آنها ندهید. موتور جستجو اگر مودب باشد قبل از ورود به هر سایتی ابتدا قوانین دسترسی به محتوای سایت را (در صورت وجود) در فایلی خاص بررسی می کند و از حقوق دسترسی خود اطلاع می یابد. تنظیم میزان دسترسی موتورهای جستجوگر به محتوای یک سایت توسط پروتکل Robots انجام می شود. به عمل کراولر ، خزش (Crawling) می گویند.

ج- Indexer (بایگانی کننده)

تمام اطلاعات جمع آوری شده توسط اسپایدر در اختیار ایندکسر قرار می گیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می گیرند و به بخش های متفاوتی تقسیم می شوند. تجزیه و تحلیل بدین معنی است که مشخص می شود اطلاعات از کدام صفحه ارسال شده است، چه حجمی دارد، کلمات موجود در آن کدامند، کلمات چندبار تکرار شده اند، کلمات در کجای صفحه قرار دارند و ... .

در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد می کند و تمام این پارامترها را به یک مقیاس عددی تبدیل می کند تا سیستم رتبه بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای کاهش حجم داده ها از بعضی کلمات که بسیار رایج هستند صرفنظر می کند. کلماتی نظیر a ، an ، the ، www ، is و ... . از این گونه کلمات هستند.

د - Database (پایگاه داده)

تمام داده های تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال می گردد. در این بخش داده ها گروه بندی، کدگذاری و ذخیره می شود. همچنین داده ها قبل از آنکه ذخیره شوند، طبق تکنیکهای خاصی فشرده می شوند تا حجم کمی از پایگاه داده را اشغال کنند. یک موتور جستجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یک موتور جستجوگر برای آن امتیاز محسوب می گردد. یکی از تفاوتهای اصلی موتورهای جستجوگر در حجم پایگاه داده آنها و همچنین روش ذخیره سازی داده ها در پایگاه داده است.و- Ranker (سیستم رتبه بندی)

بعد از آنکه تمام مراحل قبل انجام شد، موتور جستجوگر آماده پاسخ گویی به سوالات کاربران است. کاربران چند کلمه را در جعبه جستجوی (Search Box) آن وارد می کنند و سپس با فشردن Enter منتظر پاسخ می مانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جستجو شده، مرتبط هستند، مشخص می شوند. پس از آن سیستم رتبه بندی وارد عمل شده، آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب می کند و به عنوان نتایج جستجو به کاربر نمایش می دهد.

حتی اگر موتور جستجوگر بهترین و کامل ترین پایگاه داده را داشته باشد اما نتواند پاسخ های مرتبطی را ارایه کند، یک موتور جستجوگر ضعیف خواهد بود. در حقیقت سیستم رتبه بندی قلب تپنده یک موتور جستجوگر است و تفاوت اصلی موتورهای جستجوگر در این بخش قرار دارد. سیستم رتبه بندی برای پاسخ گویی به سوالات کاربران، پارامترهای بسیاری را در نظر می گیرد تا بتواند بهترین پاسخ ها را در اختیار آنها قرار دارد.

یک موتور جستجوگر به وسیله الگوریتمی که در اختیار دارد، تصمیم می گیرد که صفحات مرتبط را چگونه در نتایج جستجو مرتب و رتبه بندی کند. در حال حاضر قدرتمندترین سیستم رتبه بندی را گوگل در اختیار دارد.

مفاهیم و اصطلاحات دنیای جستجو و موتورهای جستجوگر

قبل از شروع گفتگو درباره هر موضوعی نیاز به آن است که مفاهیم اولیه و اصطلاحات رایج در آن موضوع، بیان شود تا طرفین گفتگو راحت تر به منظور یکدیگر پی ببرند. برخی از مفاهیم و اصطلاحات حوزه SEO در این مقاله شرح داده شده است.

Spider, Crawler, Robot

نرم افزاری است که کار جمع آوری اطلاعات از صفحات سایتهای مختلف را بر عهده دارد.

Directory

فهرست. نوعی از موتورهای جستجوگر که پایگاه داده آن توسط ویراستاران تکمیل می گردد. در آنها سایتها در گروههایی موضوعی دسته بندی می شوند.

Keyword

به واژه ها ی مهم (کلیدی) هر صفحه گفته می شود. اما غالبا" منظور کلماتی است که دوست داریم با آنها رتبه های مناسبی کسب کنیم.

Keyword Density

چگالی کلمه، منظور تعداد دفعات تکرار واژه های کلیدی در مقایسه با سایر کلمات متن است.

Keyword Staffing

تکرار یک کلمه به دفعات و پشت سر هم به منظور بالا بردن چگالی کلمه. این کار تقلب محسوب می شود.

Tinny Text

نوشتن متن با اندازه های بسیار کوچک و ریز به گونه ای که کلمات بسیاری بدین ترتیب در یک خط قرار داده می شود و به سختی نیز در صفحه قابل رویت هستند. نوشتن مطالب به این صورت، تقلب محسوب است.

Invisible Text

متن نامرئی. منظور استفاده از متن های همرنگ با پس زمینه صفحه است. متن هایی که از دید کاربران مخفی می ماند. به عنوان مثال اگر پس زمینه یک صفحه سیاه است، متن صفحه نیز با رنگ سیاه نوشته می شود تا دیده نشود . این نوع متن ها از مصادیق تقلب می باشند.

Spam

تقلب، به تمام تلاش هایی گفته می شود که به کمک آن سعی می شود از راه های غیر معمول، رتبه های بالایی کسب شود. یا در اختیار گذاردن اطلاعاتی که موتورهای جستجوگر آنرا دوست ندارند (اطلاعات ناخواسته) مانند تکرار یک کلمه به دفعات و پشت سر هم، استفاده از متن های هم رنگ زمینه و ...
فهرست و منابع تحقیق مقاله همه چیز درباره موتور های جستجو گر در جهان

فهرست:

ندارد.

منبع:

ندارد.

مطالب مرتبط با این موضوع:

تحقیق مقاله فاکتور های ارتقای رده بندی سایت در موتور های جستجو

تعداد صفحه: ۴۵ دسته بندی: تحقیق مقاله مهندسی کامپیوتر

مقدمه SEO یا بهینه سازی بر پایه موتورهای جستجو درواقع پاسخ به نیاز اصلی سایت های وب جهان گستر یعنی ترافیک هدفمند یا آمار بالای بازدید کنندگان از سایت است. برای داشتن بیننده در یک سایت یا به عبارت دیگری بازاریابی برای یک سایت چندین روش وجود دارد : روش نخست تبلیغات در خارج از وب است. یعنی تبلیغات به روش سنتی ، کارایی این روش به دلایل زیر چندان مناسب نیست. با وجود اینترنت و ...

گزارش سمینار بازیابی اطلاعات برای وب معنایی Information retieval for Semantic web

تعداد صفحه: ۱۲۲ دسته بندی: پایان نامه مهندسی کامپیوتر

گزارش سمینار کارشناسی ارشد چکیده با ظهور وب، داده ها و اطلاعات زیادی در موضوعات مختلف در اختیار همگان قرار گرفت ه است . اینداده ها که اکثرا در قالب فایل های HTML ارائه شده اند، فرصت مناسبی را در اختیار کاربران وب قرارداده تا بتوانند با جستجوی کلمات کلیدی مناسب به داده های مورد نیاز خود دست یابند. اما امروزه باوجود انبوهی از اطلاعات گوناگون در وب، جستجو بر اساس کلمات کلیدی، ما را ...

پایان نامه هوش ازدحامی و کاربردهای آن

تعداد صفحه: ۵۷ دسته بندی: پایان نامه مهندسی کامپیوتر

کارشناسی نرم افزار کامپیوتر در این صفحات برآن شده ایم که در مورد سیستم های ناشناخته صحبت کنیم که دارای فعالیت هایی مخصوص به خود و رفتارهایی غیر قابل پیش بینی هستند. در سالیان اخیر شاهد حرکتی مستمر، از تحقیقات صرفاً تئوری به تحقیقات کاربردی به خصوص در زمینه پردازش اطلاعات، برای مسائلی که برای آنها راه حلی موجود نیست یا به راحتی قابل حل نیستند بوده ایم. در دهه های گذشته، کوششهای ...

گزارش کارآموزی در آموزشگاه کامپیوتر شریف ابهر

تعداد صفحه: ۲۰ دسته بندی: گزارش پروژه کارآموزی مهندسی کامپیوتر

مقدمه "ان اشکر الناس الله اشکر مع الناس" «شاعرترین مردم نسبت به خدا ، حق شناسترین آنان نسبت به مردم است» شکر و سپاس ، شایسته خداوند یکتاست ، و اولین آموزگار بشر است و هم او نیاز آموختن را در وجود انسان به ودیعت گذاشته و او را تشنه آموختن ساخت که هیچ گاه از آموختن سیراب نشود. خدای بزرگ را سپاسگزارم که در راه علم یاریم نمود و از او می‎خواهم تواناییم دهد تا آموخته‎هایم را در راه ...

تحقیق مقاله آشنایی با Access و برنامه نویسی با VBA , اصول برنامه نویسی پایگاه داده

تعداد صفحه: ۱۶ دسته بندی: تحقیق مقاله مهندسی کامپیوتر

فصل اول : آشنایی با Access تاریخچه Access : در سال 1992 ، Microsoft Access به عنوان یک DBMS عرضه شد و در طی سالهای متمادی ، در رده خود به صدر رسید . Access به عنوان بخشی از مجموعه برنامه های معروف Microsoft Access روزانه توسط میلیون ها نفر استفاده می شود. از همان ابتدا Access به تدریج توسعه یافت و به برنامه ای کارآمد با کاربردی آسان مبدل شد. نگارش های اخیر آن در حالی که هم چنان ...

پایان نامه تریگرهای فازی در پایگاه داده های فعال ( Fuzzy triggers on active databases )

تعداد صفحه: ۱۰۱ دسته بندی: پایان نامه مهندسی کامپیوتر

پایان نامه برای دریافت درجه کارشناسی ارشد M.Sc. کامپیوتر چکیده پایگاه‌های داده فعال با هدف ایجاد تعامل در پایگاه‌های داده ایجاد شدند. در این نوع پایگاه داده با تعریف قوانین و بدون نیاز به کدنویسی، سیستم قادر به عکس‌العمل مناسب در مقابل رویدادهای مهم در شرایط خاص می‌باشد. تعریف قوانین ساده‌ترین نوع بیان محدودیت‌ها بوده که برای متخصص های محیط نیز قابل درک می‌باشد. اما در بیان ...

پایان نامه مدل سازی شدت تصادفات موتورسیکلت در شهرهای متوسط با بافت قدیمی مطالعه موردی شهرکاشان

تعداد صفحه: ۱۳۷ دسته بندی: پایان نامه مهندسی عمران

پایان نامه برای دریافت درجه کارشناسی ارشد ”M.Sc مهندسی عمران – برنامه ریزی حمل ونقل چکیده : در این تحقیق فاکتورهای موثر بر تصادفات وسایل نقلیه شهر کاشان با استفاده از آمار تصادفات گردآوری شده از فرمهای اطلاعات تصادفات راهنمایی و رانندگی و همچنین مطالعات ترافیکی شهرداری کاشان در سالهای ١٣٨٣ تا ١٣٨۵ که شامل ۴٧١١ مورد تصادف است شناسایی شده و با استفاده از مدل لوجیت دوگانه احتمال به ...

تحقیق مقاله سیستم های خبره

تعداد صفحه: ۶۹ دسته بندی: تحقیق مقاله مدیریت

مقدمه ای بر سیستم های خبره سیستم خبره چیست؟ اولین قدم در حل هر مسئله ای تعریف دامنه یا محدوده آن است. این نکته همانطور که در مورد روشهای برنامه نویسی متعارف صحت دارد، در مورد هوش مصنوعی نیز درست است. اما به خاطر اسراری که از قبل در مورد هوش مصنوعی ( AI ) وجود داشته، هنوز هم برخی مایلند این عقیده قدیمی را باور کنند که " هر مسئله ای که تا به حال حل نشده باشد یک مسئله هوش مصنوعی ...

تحقیق مقاله موشک

تعداد صفحه: ۲۰ دسته بندی: تحقیق مقاله صنایع دفاع - نظامی

مقدمه کوتاهی بر موشک هر وسیله پرنده از یک نیروی جلوبرنده برای غلبه بر نیروهائی که طبیعت به آن وارد می کند و همچنین پیشروی استفاده می کند. در وسایل پرنده این نیروی جلوبرنده توسط انواع موتورهای توربوجت، توربوفن، توربوپراپ، توربوشافت، رم جت، اسکرم جت و موتورهای راکت سوخت جامد و سوخت مایع به دست می آید. انواع موتورهای یاد شده از یک ماده سوختنی و یک اکسیدکننده برای ایجاد نیروی ...

تحقیق مقاله اینترنت و سرمایه‌ی اجتماعی

تعداد صفحه: ۲۴ دسته بندی: تحقیق مقاله مهندسی کامپیوتر

چکیده آیا ارتباطات اینترنتی، تعهد اجتماعی، مشارکت و تماس بین فردی را افزایش،کاهش یا تکمیل می‌سازد؟ مدرک و دلیلمان حاصل بررسیهای به عمل آمده درخصوص211/39 بازدید کننده وب سایت انجمن جغرافیای ملی، یکی از اولین بررسی‌های وب در مقیاس وسیع می‌باشد.حاصل بررسی فوق، حاکی از این بودکه تأثیر متقابل افراد آنلاین ارتباط رودررو وتلفنی شان را، بدون افزایش،یاکاهش آن، تکمیل می‌سازد. با این وجود ...

ثبت سفارش

عنوان محصول

قیمت

تحقیق مقاله همه چیز درباره موتور های جستجو گر در جهان

خلاصه تحقیق مقاله همه چیز درباره موتور های جستجو گر در جهان

فهرست و منابع تحقیق مقاله همه چیز درباره موتور های جستجو گر در جهان