آنی پیپر
دانلود فایل‌های آموزشی دانش‌آموزی و دانشجویی

پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان

تعداد صفحات: 218 فرمت فایل: word کد فایل: 1000913
سال: 1386 مقطع: کارشناسی ارشد دسته بندی: پایان نامه مهندسی کامپیوتر

قیمت قدیم:۲۸,۴۰۰ تومان

قیمت: ۲۶,۳۰۰ تومان

دانلود فایل

کلمات کلیدی: SQL SERVER2005 - بانک اطلاعاتی - پایگاه داده - خوشه بندی - داده کاوی

خلاصه
فهرست و منابع

خلاصه پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان

پایان نامه دوره کارشناسی کامپیوتر

گرایش نرم افزار

چکیده

بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005

پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان

    امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.

   داده کاوی یکی از مهمترین روش ها ی کشف دانش است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.داده کاوی را تحلیل گران با اهداف گوناگونی از قبیل کلاس بندی, پیش بینی, خوشه بندی ,تخمین انجام می دهند. برای کلاس بندی, مدل هاو الگوریتم هایی مانند قاعده ی بیز, درخت تصمیم, شبکه ی عصبی, الگوریتم ژنتیک مطرح شده است.برای پیش بینی مدل رگرسیون خطی ومنطقی و برای خوشه بندی الگوریتم های سلسله مراتبی و تفکیکی, وبرای تخمین مدل های درخت تصمیم و شبکه ی عصبی مطرح می شود. در فصل دوم و سوم با الگوریتم ژنتیک که یکی از الگوریتم های داده کاوی و با شبکه ی عصبی که یکی از مدل های داده کاوی هستند آشنا می شویم .درفصل چهارم به محاسبات نرم و برخی از اجزای اصلی ان و نقش آنها در داده کاوی می پردازیم.

    در فصل پنجم با ابزارهای داده کاوی آشنا می شویم . برای داده کاوی ابزارهای متنوعی وجود دارد. می توان ابزارداده کاوی را با تطبیق آن ابزار با داده های مسئله و با توجه به محیط داده ای که می خواهید از آن استفاده کنید، و امکاناتی که آن ابزار دارد انتخاب کنید.وسپس به داده کاوی با SQLSERVER2005 می پردازیم .ودرفصل ششم به داده کاوی با SQL SERVER2005 روی بانک اطلاعاتی دانشگاه آزاد قوچان پرداختیم.

کلمات کلیدی ،کلاس بندی ، خوشه بندی ، پیش بینی ، تخمین

مقدمه ای بر داده کاوی

1-مقدمه

    امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .با استفاده از ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها خیلی بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شوند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش[1] بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .

   داده کاوی[2] یکی از مهمترین این روش ها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .

1-2-عامل مسبب پیدایش داده کاوی

    اصلی ترین دلیلی که باعث شده داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها, اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی مورد استفاده قرار می گیرد.

    داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها.

   تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع آوری حجم فراوانی داده شده است. این داده های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم.

   ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای داده ها را کشف می کنند که می توان از آن در کاربردهایی نظیر تعیین استراتژی برای کسب و کار، پایگاه دانش[3] و تحقیقات علمی و پزشکی، استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم .

1

-3-داده کاوی و مفهوم اکتشاف دانش    (K.D.D)

   با حجم عظیم داده های ذخیره شده در فایلها، بانکهای اطلاعاتی و سایر بانک های داده ای، توسعه ی ابزارهایی برای تحلیل و شاید تفسیر چنین داده هایی و برای استخراج علوم شگفت انگیزی که می توانند در تصمیم گیری مفید باشند، امری بسیار مهم و ضروری است. داده کاوی با عنوان کشف دانش در پایگاه های داده (KDD) شناخته می‌شود. کشف علومی که قبلا ناشناخته بوده‌اند و اطلاعاتی که در بانکهای اطلاعاتی موجود بوده و ذاتا بالقوه و مفید هستند.

   با وجود آنکه داده کاوی و کشف دانش در پایگاه‌های داده مترادف همدیگر هستند، ولی در اصل، داده کاوی ذاتاً بخشی و تنها قسمتی جزئی از فرآیند کشف دانش است. فرآیند کشف دانش در بر گیرنده ی چندین مرحله می باشد که از اطلاعات خام، گونه هایی از علوم جدید را بدست می دهد. مراحل کشف دانش به قرار زیر است:

1- پاکسازی داده ها : در این فاز داده های اضافی و نامربوط از مجموعه داده ها حذف می شوند.(داده های ناکامل) [2]

2-یکپارچه سازی داده ها[4] : چندین منبع داده ترکیب می شوند،

   3-انتخاب داده ها : انبار داده ها شامل انواع مختلف و گوناگونی از داده ها است که همه آنها در داده کاوی مورد نیاز نیستند . برای فرایند داده کاوی باید داده ها ی مورد نیاز انتخاب شوند . به عنوان مثال در یک پایگاه داده های مربوط به سیستم فروشگاهی ، اطلاعاتی در مورد خرید مشتریان ، خصوصیات آماری آنها ، تامین کنندگان ، خرید ، حسابداری و ... وجود دارند . برای تعیین نحوه چیدن قفسه ها تنها به داده ها یی در مورد خرید مشتریان و خصوصیات آماری آنها نیاز است . حتی در مواردی نیاز به کاوش در تمام محتویات پایگاه نیست بلکه ممکن است به منظور کاهش هزینه عملیات ، نمونه هایی از عناصر انتخاب و کاوش شوند .

   4-تبدیل داده ها : هنگامی که داده های مورد نیاز انتخاب شدند و داده های مورد کاوش مشخص گردیدند، معمولا به تبدیلات خاصی روی داده ها نیاز است. نوع تبدیل به عملیات و تکنیک داده کاوی مورد استفاده بستگی دارد، تبدیلاتی ساده همچون تبدیل نوع داده ای به نوع دیگر تا تبدیلات پیچیده تر همچون تعریف صفات جدید با انجام عملیاتهای ریاضی و منطقی روی صفات موجود.

5-داده کاوی : بخش اصلی فرایند ، که در آن با استفاده از روش ها و تکنیک های خاص ، استخراج الگو های مفید ، دانش استخراج می شود.

6-زیابی الگو[5] : مشخص کردن الگوهای صحیح و مورد نظر به وسیله معیارهای اندازه گیری.

7-زنمایی دانش : در این بخش به منظور ارائه دانش استخراج شده به کاربر ، از یک سری ابزارهای بصری سازی استفاده می گردد.

1-3-1-تعریف داده کاوی

   در متون آکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده اند . در برخی از این تعاریف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده ها می سازد معرفی گردیده است و در برخی دیگر ، تعاریف دقیقتر که درآنها به کاوش در داده ها توجه می شود. برخی از این تعاریف عبارتند از :

داده کاوی عبارت است از فرایند استخراج اطلاعات معتبر ، از پیش ناشناخته قابل فهم و قابل اعتماد از پایگاه داده های بزرگ که شامل بهره گیری از بزارهای آنالیز داده ها، برای کشف الگوهای موجود و روابط ناشناخته‌ی میان داده ها در حجمی وسیع می باشد. و استفاده از آن درتصمیم گیری فعالیتهای تجاری مهم.

اصطلاح داده کاوی به فرایند نیم خودکار تجزیه و تحلیل پایگاه داده های بزرگ به منظور یافتن الگوهای مفید اطلاق می شود [3].

داده کاوی یعنی جستجو در یک پایگاه داده ها برای یافتن الگوهایی میان داده ها [4].

داده کاوی یعنی استخراج دانش کلان ، قابل استناد و جدید از پایگاه داده ها ی بزرگ .

داده کاوی یعنی تجزیه و تحلیل مجموعه داده های قابل مشاهده برای یافتن روابط مطمئن بین داده ها .

   همانگونه که در تعاریف گوناگون داده کاوی مشاهده می شود ، تقریبا در تمامی تعاریف به مفاهیمی چون استخراج دانش ، تحلیل و یافتن الگوی بین داده ها اشاره شده است .

[1] Knowledge Discovery

[2] Data Mining

[4] Data integration

[5] Pattern evaluation
فهرست و منابع پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان

فهرست:

ندارد.

منبع:

[1]:

J.Han, and M.Kamber, “Data Mining: Concepts and Techniques”, San Diego Academic Press, 2001

[2]:

Matjaz Gams, Nada Lavarc, Review Of Five Emperical Learning Systems Whitin a Proposal Schemata,1987 , EWSL87.

[3]:

Introduction to Data Mining and Knowledge Discovery By Two Crows Corporation

[4]:

David J. HAND , Data Mining: Statistics and More? , December 2002.

[5]:

Jeffery W. Seifert , Analyst in information science and Technology Policy, ‘ Data Mining : An Overview ‘ December 2004.

[6]:

Ruby L. Kennedy, Yuchung Li, Benjamin Van Roy, Christopher D. Reed, Dr. Richard P. Lippmann, Solving Data Mining Problems Through Pattern Recognition, 1997.

[7]:

J.Han, M.Kamber, Date Mining: Goncepts and Techinqeus, JimGray, Series Editor Morgan Kaufmann Publishers, Augest 2000.

[8]:

  Artificial Intelligence, 1994] P. Langley and S. Sage. Induction of Selective      Bayesian Classifiers. Proc. 10th Conf. on

[9]:

Two Crows Corporation,Introduction to Data Mining and Knowledge Discovery,1999

[10]:

Ruby L. Kennedy, Yuchung Li, Benjamin Van Roy, Christopher D. Reed, Dr. Richard P. Lippmann, Solving Data Mining Problems Through Pattern Recognition, 1997.

                                                                                                                                   [11]:

http://www.30sharp.com



[12] P. Berkhin, Survay of clustering Data Mining Techniques, Accrue Software, CA. 2002.



[13]:

Sarawagi, Thomas, Agrawal, Integrating Association Rule Mining with Relational Database Systems: Alternative and Implecations

[14]:

Ramakrishnan Srikant, Rakesh Agrawal, Mining Quanitative Associattion Rules in Large Relational Tables, 1995.

[15]:

Sehgal, A.K. Text Mining: The Search for Novelty in Text. Ph.D. Comprehensive Examination Report, Dept. of Computer Science, The University of Iowa, April 2004

[16] :

H. Zhuge et al. An Automatic Semantic Relationships Discovery Approach. The 13th International World Wide Web Conference (WWW2004), New York, USA, May 2004,

[17]:

M. Rajman. Text Mining, knowledge extraction from unstructured textual data. Proc. of EUROSTAT Conference, Francfort (Deutchland), may, 1997

[18]:

M. A. Hearst. Untangling text data mining. In Proceedings of the ACL’99: the 37th Annual Meeting of the Association for Computational Linguistics. University of Maryland, June 20-26 1999

[19]:

Dr Alex Rogers , CM2408 – Symbolic Al Lecture 8 – Introduction to Genetic Algorithms ,December 2002

[20]:

Mehrdad Dianati , Insop Song , Mark Treiber , An Introduction to Genetic Algorithms and Evolution Strategies

                                                         [21]:

http--www.genetic-programming.com

[22]:

[email protected]

[23]:

www.talkorigins.org

[24]:

www.ccwmagazine.com

[25]:

www.gpwiki.org

[26 ]:

http://developercenter.ir/Forum/index.php

[27]:

cortex.snowseed.com-neuralnetworks.htm

[28]:

R.Kohavi, B.Masand,M.Spilipoulou ,and J.Srivastava, “WebMining “: DATA Mining and Knowlede Disscovery, vol.6,pp.5-8.2002

[29]:

J.Zhan,W.Hsu, and M.L.Lee, “Image mining :Issues , frameworks and techniques ,” in proceedings of the 2nd international workshop on milti –media data mining and the ACM SIGKDD Conference (MDM/KDD ’01)(San Francisco), pp.13-20 , August 2001.

[30]:

A.Vailaya .A.T,Fiueiredo,A.K.Jain , and H.J.Zhang, “ Image classification for content –based indexing ,” IEEE Transactions on Image processing ,vol .10,pp.117-130 ,2001.

[31]:

http://msdn.microsoft.com/msdntv/episode.aspx?xml=episodes/en/20050804SQLServerJM/manifest.xml

.

مطالب مرتبط با این موضوع:

پروژه Data Mining ( داده کاوی )

تعداد صفحه: ۸۸ دسته بندی: پایان نامه مهندسی کامپیوتر

پروژه کارشناسی رشته نرم افزار چکیده: در دو دهه قبل تواناییهای فنی بشر برای تولید و جمعآوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسبوکار، علوم، خدمات دولتی و پیشرفت در وسائل جمعآوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهوارهای، در این تغییرات نقش مهمی دارند. بطور کلی ...

پایان نامه کاربرد داده کاوی در تجارت الکترونیک

تعداد صفحه: ۱۵۱ دسته بندی: پایان نامه مهندسی فناوری اطلاعات IT

چکیده: این پایان نامه شامل دو بخش می باشدبخش اول در مورد داده کاوی و تکنیکها و متدلوژی های ان و بخش دوم در مورد تجارت الکترونیک می باشد. بخش اول شامل مطالبی در مورد عناصر داده کاوی و سپس کاربردهای داده کاوی در موارد مختلف و تفاوت داده کاوی با پایگاه داده و متدلوژی ها و مراحل داده کاوی وهمچنین وظایف داده کاوی توضیحاتی داده شده است. بخش دوم در مورد تجارت الکترونیکی که در ان مقدمه ...

تحقیق مقاله بانک اطلاعاتی

تعداد صفحه: ۱۳ دسته بندی: تحقیق مقاله مهندسی کامپیوتر

مقدمه: بانک اطلاعاتی مجموعه ای مجتمع و گرد آوری شده از فایل های اطلاعاتی مکانیزه است که در راستای یک هدف مشترک و مشخص با یکدیگر مرتبط می باشد. بانک اطلاعاتی مجموعه ای مرتبط از اطلاعات قابل کنترل به منظور به کارگیری در یک یا چند کاربرد به صورت انتخابی و اختیاری ،این اطلاعات را طوری جمع آوری شده و تشکیل مجموعه می دهد که مستقل از برنامه هایی که آنها را مورد استفاده قرار خواهد داده ...

پایان نامه نرم افزار بانک اطلاعاتی

تعداد صفحه: ۹۶ دسته بندی: پایان نامه مهندسی کامپیوتر

چکیده تاریخچه پایگاه داده اولین کاربردهای اصطلاح پایگاه داده به June 1963 باز می‌گردد، یعنی زمانی که شرکت System Development Corporation مسئولیت اجرایی یک طرح به نام "توسعه و مدیریت محاسباتی یک پایگاه داده‌ای مرکزی" را بر عهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهه 70 در اروپا و در اواخر دهه 70 در خبر نامه‌های معتبر آمریکایی به کار رفت.(بانک داده‌ای یا Databank در ...

پایان نامه بررسی پایگاه داده در محیط نرم‌ افزارهای ACCESS , SQL

تعداد صفحه: ۱۲۵ دسته بندی: پایان نامه مهندسی کامپیوتر

مروری بر SQL تاریخچه SQL از لابراتوار IBM در سان خوزه کالیفرنیا شروع می‌شود. جایی که SQL در اواخر دهه 1970 میلادی شکل گرفت. کلمه SQL برگرفته از حروف اول کلمات Structuted Query Language ساخته شده و اغلب اوقات اشاره به 'sequel' می‌‍‌کند. این زبان ابتدا برای محصول DB2 شرکت IBM (یک سیستم مدیریت پایگاه داده‌ای رابطه‌ای یا RDBMS که امروزه نیز برای بعضی محیط‌ها فروخته می‌شود، طراحی ...

تحقیق مقاله آشنایی با Access و برنامه نویسی با VBA , اصول برنامه نویسی پایگاه داده

تعداد صفحه: ۱۶ دسته بندی: تحقیق مقاله مهندسی کامپیوتر

فصل اول : آشنایی با Access تاریخچه Access : در سال 1992 ، Microsoft Access به عنوان یک DBMS عرضه شد و در طی سالهای متمادی ، در رده خود به صدر رسید . Access به عنوان بخشی از مجموعه برنامه های معروف Microsoft Access روزانه توسط میلیون ها نفر استفاده می شود. از همان ابتدا Access به تدریج توسعه یافت و به برنامه ای کارآمد با کاربردی آسان مبدل شد. نگارش های اخیر آن در حالی که هم چنان ...

پایان نامه ارتباط با پایگاه داده‌های Access در Visual Basic

تعداد صفحه: ۱۲۴ دسته بندی: پایان نامه مهندسی کامپیوتر

پروژه فارغ التحصیلی ما در عصری زندگی می‌کنیم که آن را عصر اطلاع رسانی یا قرن ارتباطات نامیده‌اند، لذا می‌توان اذعان نمود که کامپیوتر بهترین ابزار ارتباطی در آن عصر می‌باشد. امروزه کامپیوتر نه تنها به عنوان یک وسیله شخصی یا ابزار گروهی خاص مورد استفاده قرار می‌گیرد، بلکه به عنوان یک وسیله ارتباطی مهم در جهان مطرح می‌باشد و به همین دلیل است که کاربرد آن روز به روز در جهان گسترش ...

پایان نامه سیستم فروش شرکت تحت وب

تعداد صفحه: ۷۰ دسته بندی: پایان نامه مهندسی کامپیوتر

برای دریافت لیسانس کامپیوتر نرم افزارهای استفاده شده : Access ، HTML ، ASP و SQL مقدمه ای بر بانک اطلاعاتی اکسس تاریخچه مختصر پایگاه داده ها سیستمهای پایگاه داده ها برای ذخیره کردن اطلاعات به کار می رود. هم سیستمهای بزرگ زررواسیون شرکتهای هواپیمایی و هم دفترچه تلفنی که درجیب شما قراردارد پایگاه دادها محسوب می شوند زیرا از آنها برای ذخیره کردن داده ها و بازیابی اطلاعات استفاده ...

پایان نامه سیستم خرید و فروش اینترنتی شرکت فراز رایانه

تعداد صفحه: ۱۰۹ دسته بندی: پایان نامه مهندسی کامپیوتر

در این پروژه پس از گفتگو با مدیریت شرکت ،بررسی خواسته ها و نیازهای ایشان ، نحوه عملکرد و رووابط موجود تحلیل سیستم آغاز شد با توجه به اینکه امروزه اینترنت به عنوان یک ابزار نیرومند اطلاع رسانی شناخته شده و روز به روز بر محبوبیت وتعدا کاربران آن افزوده می شود و ابزار قدرتمندی برای بازیابی و تبلیغ در جهت توسعه فعالیتها در سطح جهان است.پیاده سازی این سیستم تحت شبکه جهانی وب (web ...

پروژه طراحی سایت پروژه های دانشجویی

تعداد صفحه: ۶۰ دسته بندی: پایان نامه مهندسی کامپیوتر

پروژه دوره کارشناسی در رشته مهندسی کامپیوتر گرایش نرم افزار پیشگفتار وب یکی از مهمترین و در عین حال جوان ترین سرویس های اینترنت است که در مدت زمانی کوتاه توانسته است در کانون توجه تمامی استفاده کنندگان اینترنت قرار بگیرد و منشاء تحولات عمده ای در حیات بشریت باشد. در گذشته از وب صرفا" به منظور عرضه اطلاعات استفاده می گردید و کاربران از آن به عنوان یک کنابخانه الکترونیکی بزرگ و در ...

ثبت سفارش

عنوان محصول

قیمت

پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان

خلاصه پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان

فهرست و منابع پایان نامه بررسی ومطالعه ی کامل داده کاوی و داده کاوی با SQL SERVER2005 پیاده سازی آن روی بانک اطلاعاتی دانشگاه آزاد قوچان