تحقیق بهینه‌سازی و پردازش پرس و جو

تحقیق بهینه‌سازی و پردازش پرس و جو
دسته بندی کامپیوتر و IT
بازدید ها 0
فرمت فایل doc
حجم فایل 433 کیلو بایت
تعداد صفحات فایل 103
تحقیق بهینه‌سازی و پردازش پرس و جو

فروشنده فایل

کد کاربری 26386
کاربر

تحقیق بهینه‌سازی و پردازش پرس و جو

بخشهایی از متن:

مقدمه:

در این تحقیق ما به تکنیک‌های بکار رفته توسط DMBS برای پردازش، بهینه‌سازی و اجرای پرس و جوهای سطح بالا می‌پردازیم.

پرس و جوی بیان شده در زبان پرس‌و جوی سطح بالا مثل SQL ابتدا باید پویش و تجزیه . معتبر شود. پویشگر (اسکنر) علامت هر زبان، مثل لغات کلیدی SQL، اساس ویژگی، و اساس رابطه، را در متن پرس و جو شناسایی می‌کند،‌ در عوض تجربه کننده، ساختار دستوری پرس و جو را برای تعیین اینکه آیا بر طبق قوانین دستوری زبان پرس و جو تدوین می‌شود یا خیر، چک می‌کند. پرس و جو باید همچنین معتبر شود، با چک کردن اینکه تمام اسامی رابطه و ویژگی معتبر هستند و اسامی معنی‌دار در طرح پایگاه اطلاعاتی ویژها‌ی پرس و جو می‌شوند. نمونه داخلی پرس و جو ایجاد می‌شود،‌‌ که تحت عنوان ساختار داده‌های درختی بنام درخت پرس و جو می‌باشد. ارائه پرس و جو با استفاده از ساختار داده‌های گراف بنام گراف پرس و جو نیز امکان پذیر است. DOMS باید استراتژی اجرایی برای بازیابی نتیجه پرس و جو از فایل‌های پایگاه اطلاعاتی را هدایت کند. پرس و جو استراتژیهای اجرایی بسیاری دارد. و مرحلة انتخاب،‌ مورد مناسبی برای پردازش پرس وجو تحت عنوان بهینه‌سازی پرس و جو شناخته شده است.

...

اصطلاح بهینه‌سازی نام بی مسمایی است چون در بعضی موارد،‌ طرح اجرایی انتخاب شده، استراتژی بهینه نمی‌باشد، آن فقط استراتژی کارآمد معقول برای اجرای پرس و جو است. یافتن استراتژی بهینه، ضامن صرف زمان زیادی است، بجز برای ساده‌ترین پرس و جوها،‌ ممکن است به اطلاعاتی روی چگونگی اجرای فایل‌ها در فهرست‌های فایل‌ها، اطلاعاتی که ممکن است کاملاً در کاتالوگ DBMS در دسترس نباشد، نیاز باشد. از اینرو،‌ برنامه‌ریزی استراتژی اجرا ممکن است توصیف درست‌تری نسبت به بهینه‌سازی پرس و جو باشد.

برای زبانهای پایگاه اطلاعاتی (دریایی) جهت‌یابی در سطح پایینتر در سیستم‌های قانونی، مثل شبکه DML شبکه‌ای یا MOML سلسله مراتبی،‌ برنامه نویس باید، استراتی اجرای پذیرش و جو را انتخاب کند ضمن اینکه برنامه پایگاه اطلاعاتی را می‌نویسد. اگر DBMS فقط زیان جهت‌یابی را ارائه دهد. فرصت و نیاز محدودی برای بهینه‌سازی پرس وجوی وسیع توسط DBMS وجود دارد، در عوض به برنامه نویس قابلیت انتخاب استراتژی اجرایی بهینه ارائه می‌شود. بعبارت دیگر، زبان پرس و جو در سطح بالا، مثل SQL برای DBMSهای رابطه‌ای یا OQL برای DBMS‌های مقصد،‌ در ماهیت تفریطی‌تر است. چون آنچه نتایج مورد نظر پرس و جو است بغیر از شناسایی جزئیات چگونگی بدست آمدن نتیجه،‌ را تعیین می‌کند. بهینه‌سازی پرس و جو برای پرس و جوهایی ضروی است که در زبان پرس و جوی سطح بالا تعیین می شوند. ما روی توصیف بهینه‌سازی پرس و جو در زمینه ROBMS تمرکز می‌کنیم چون بسیاری از تکنیک‌هایی که توصیف می‌ کنیم برای، برای ODBMSها تطبیق یافته‌اند. DBMS رابطه‌ای باید استراتژیهای اجرای پرس و جوی دیگری را ارزیابی کند و استراتژی بهینه یا کارآمد معقولی را انتخاب کند. هر DBMS ،‌ تعدادی الگاریتم دسترسی به پایگاه اطلاعاتی کلی دارد که علامتهای رابطه‌ای مثل SELECT یا JOIN یا ترکیبی از این عملیات ‌ها را اجرا می‌کند. تنها استراتژیهای اجرایی که می‌توانند توسط الگاریتم‌های دسترسی DBMS اجرا شوند و برای طراحی پایگاه اطلاعاتی فیزیکی ویژه و پرس و جوی خاص بکار روند،‌ می‌توانند توسط قطعه برنامه بهینه‌سازی پرس و جو در نظر گرفته شوند.

...

یکی از قوانین ذهنی اصلی، جهت بکارگیری عملیات های PROJECT , SELECT قبل از بکارگیری عملیات های JOIN و بنیادی دیگر است. این بدین علت است که اندازه فایل ناشی از عملیات بنیادی، مثل JOIN ، معمولاً تابع مضروب اندازه های فایل های ورودی است. عملیات های SELECT و PROJECT ، اندازه فایل را کاهش می دهند و از اینرو باید قبل از عملیات JOIN (اتصال) و عملیات بنیادی دیگر بکار گرفته شود.

ما در بخش 1. 3. 18 با ارائه درخت پرس و جو و نمادهای گراف پرس و جو کار را ‎آغاز می کنیم. اینها بعنوان پایه و اساس برای ساختارهای داده هایی استفاده می شوند که برای نمونه داخلی پرس و جوها بکار می روند. درخت پرس و جو برای ارائه عبارت جبری رابطه ای توسعه یافته یا عبارت جبری رابطه ای بکار می رود،‌در عوض گراف پرس و جو برای نشان دادن عبارت حسابان رابطه ای استفاده می شود. وقتی در بخش 2 . 3. 18 نشان می دهیم که چطور قوانین بهینه سازی ذهنی برای تبدیل درخت پرس و جو به درخت پرس و جوی معادل بکار می روند، که عبارت جبری رابطه ای متفاوتی را نشان می دهد که برای اجرا کارآمدتر است ولی همان نتیجه اولیه را ارائه می دهد. ما روی تعادل و توازن عبارات جبری رابطه ای گوناگون بحث می کنیم.