طراحی و پیاده سازی پایگاه داده های توزیع شده همگن

طراحی و پیاده سازی پایگاه داده های توزیع شده همگنReviewed by پرشین مقاله on Feb 19Rating: ۴.۵طراحی و پیاده سازی پایگاه داده های توزیع شده همگنطراحی و پیاده سازی پایگاه داده های توزیع شده همگن مشتمل به۹۳صفحه می باشد. برای خرید مقاله طراحی و پیاده سازی پایگاه داده های توزیع شده همگن اقدام نمایید.
سفارش تحقیق
http://telegram.me/pmaghale

پیشرفت تکنولوژی سیستم های مدیریت پایگاه داده ها ، با توسعه تکنولوژی های محاسبات توزیع شده وپردازش های موازی همگام شده است. نتیجه این همگامی ، سیستم های مدیریت پایگاه داده های توزیع شده و موازی است .سیستم های پایگاهی توزیع شده ، مجموعه ای از چندین پایگاه داده های  منطقاً مرتبط است که دریک شبکه کامپیوتری گسترده شده اند . اینگونه از سیستم های پایگاهی در عین دارا بودن مزایایی همچون :

  • سازگاری و هماهنگی با ماهیت سازمان های نوین
  • کارایی بیشتر در پردازش داده ها به ویژه در پایگاه داده های بزرگ

این تحقیق دانشجویی طراحی و پیاده سازی پایگاه داده های توزیع شده همگن مشتمل بر ۹۳صفحه است، برای دیدن فهرست مطالب مقاله و جزئیات آن به اطلاعات اضافی زیر مراجعه فرمایید.

فهرست مطالب

مطالعات نظری.. ۷

فصل اول. ۸

  1. سیستم پایگاهی توزیع شده ۹

تعاریف… ۹

  1. مزایا و معایب سیستم پایگاهی توزیع شده ۱۳

۲.۱. مزایا: ۱۴

۲.۲.   معایب: ۱۴

  1. چند سیستم نمونه. ۱۴
  2. یک اصل بنیادی.. ۱۵
  3. دوازده قاعده فرعی.. ۱۷

۵.۱.  خود مختاری محلی.. ۱۷

۵.۲.   عدم وابستگی به یک مانه مرکزی.. ۱۸

۵.۳. استمرار عملیات… ۱۸

۵.۴. استقلال از مکان ذخیره سازی.. ۱۹

۵.۵.  استقلال از چگونگی پارسازی داده ها ۱۹

۵.۶. استقلال ازچگونگی نسخه سازی داده ها ۲۲

۵.۷.  پردازش در خواست های توزیع شده ۲۴

۵.۸.  مدیریت تراکنش های توزیع شده ۲۴

۵.۹.   استقلال از سخت افزار. ۲۵

۵.۱۰.استقلال از سیستم عامل.. ۲۵

۵.۱۱.   استقلال از شبکه. ۲۵

۵.۱۲. استقلال از DBMS. 26

  1. پایگاه داده های توزیع شده همگن و ناهمگن.. ۲۶
  2. مشکلات سیستم های توزیع شده ۲۶

۷.۱. پردازش در خواست… ۲۷

۷.۲.   مدیریت کاتالوگ… ۳۰

۷.۳.  انتشار بهنگام سازی.. ۳۳

۷.۴. کنترل ترمیم. ۳۴

۷.۵.  کنترل همروندی.. ۳۶

  1. گدار. ۳۸
  2. مقایسه سیستم های مشتری/خدمتگزار با سیستم های توزیع شده ۴۰
  3. خلاصه. ۴۱
  4. نتیجه گیری.. ۴۲

فصل دوم. ۴۳

  1. سیستم های پایگاه داده های توزیع شده و موازی.. ۴۴
  2. توازی بین درخواست ها ۴۶
  3. نگاهی دقیقتر به تکنولوژی پایگاه داده های توزیع شده وموازی.. ۵۱

۳.۱.   سطح و نوع توزیع شدگی داده ها ومسئولیت ها در  DDBMSهای مختلف…. ۵۲

۳.۲.پردازش و بهینه سازی درخواست… ۵۵

۳.۳.   کنترل همروندی (Concurency control) 63

۳.۴.   پروتکل های قابلیت اطمینان. ۶۷

  1. خلاصه. ۷۷
  2. نتیجه گیری.. ۷۸

فصل سوم. ۷۹

  1. تاریخچه. ۸۰
  2. جنبه هایاوراکل برای سیستم های توزیع شده ۸۲
  3. خطوط اتصال پایگاه داده ها ۸۲

۳.۱.  رده بندی database link بر اساس نحوه برقراری ارتباط.. ۸۳

ضرورت استفاده از database link ها ۸۳

۳.۲. بکارگیری اسامی سراسری پایگاه داده هادر database link ها ۸۴

۳.۳. نامگذاری database link ها ۸۵

۳.۴. گونه های مختلف database link. 85

۳.۵.مقایسه کاربران ِ گونه های مختلف database link ها ۸۶

۳.۶. مثال هایی از تعریف database link در سیستم های توزیع شده پایگاه داده ها ۸۷

  1. عملیات روی داده های ذخیره شده در پایگاه داده های توزیع شده اوراکل.. ۸۸

فصل چهارم. ۸۹

  1. توزیع داده ها ۹۰

۱.۱.   استراتژی های توزیع داده ها ۹۰

۱.۲. تخصیص داده ها ۹۱

۱.۳. طرح توزیع و تخصیص مناسب برای DDB خوابگاه دانشگاه شهید بهشتی.. ۹۱

۱.۴انتخاب طرح توزیع DDB خوابگاه دانشگاه شهید بهشتی.. ۹۱

.

خلاصه ای کوتاه از مقاله طراحی و پیاده سازی پایگاه داده های توزیع شده همگن را در زیر می توانید ببینید.

پیشگفتار

پیشرفت تکنولوژی سیستم های مدیریت پایگاه داده ها ، با توسعه تکنولوژی های محاسبات توزیع شده وپردازش های موازی همگام شده است. نتیجه این همگامی ، سیستم های مدیریت پایگاه داده های توزیع شده و موازی است .سیستم های پایگاهی توزیع شده ، مجموعه ای از چندین پایگاه داده های  منطقاً مرتبط است که دریک شبکه کامپیوتری گسترده شده اند .

اینگونه از سیستم های پایگاهی در عین دارا بودن مزایایی همچون :

  • سازگاری و هماهنگی با ماهیت سازمان های نوین
  • کارایی بیشتر در پردازش داده ها به ویژه در پایگاه داده های بزرگ

تعاریف

پایگاه داده: مجموعه ای است از داده های ذخیره شده و پایا، بصورت مجتمع (یکپارچه) (نه لزوماً همیشه بطور فیزیکی، بلکه حداقل بطورمنطقی)، بهم مرتبط، حتی الامکان با کمترین افزونگی، (دارای یک ساختار منطقی مبتنی بر یک مدل داده ای و توصیف شده بویژه در محیط انتزاعی یعنی در چارچوب همان مدل داده ای )، تحت مدیریت یک سیستم کنترل متمرکز، مورد استفاده یک یا چند کاربر از یک(یا بیش از یک)«سیستم کاربردی»،بطور همزمان و اشتراکی.]روحا۸۳[

مزایا و معایب سیستم پایگاهی توزیع شده

پیشرفت تکنولوژی سیستم های مدیریت پایگاه داده ها، با توسعه تکنولوژی محاسبات توزیع شده و پردازش های موازی همگام شده است. نتیجه نهایی این دو سیستم های مدیریت پایگاه داده های توزیع شده و موازی است. سازمانها بطور معمول، دارای ماهیت توزیع شده هستند. این توزیع بطور منطقی و بصورت زیر بخش ها، دپارتمان ها و گروه های کاری و در اکثر مواقع بطور فیزیکی می باشد. در نتیجه سیستم توزیع شده ، ما را قادر می سازد تا ساختار پایگاه داده های مورد نیاز سازمانها را شبیه ساختار واقعی آنها ایجاد کنیم. بدین صورت که، داده محلی را می توان همانطور محلی نگه داری کرد در حالیکه در صورت نیاز امکان دسترسی به داده های دور  بطور همزمان نیز وجود داشته باشد .

۱- منظور، توزیع فیزیکی تاسیسات ، کارخانه ها و … است که به بطور معمول توزیع داده ها را به دنبال دارد . چون هر واحد سازمان که عضو شبکه می باشد ،منطقاً داده های مرتبط به کار خود را نگه داری می کند.

مزایا:

  • سازگاری و هماهنگی با ماهیت سازمان های نوین
  • کارایی بیشتر در پردازش داده ها به ویژه در پایگاه داده های بزرگ
  • دستیابی بهتر به داده ها
  • اشتراک داده ها
  • افزایش پردازش موازی

 

دوازده قاعده فرعی

 

  1. خود مختاری محلی

مانه ها در سیستم توزیع شده پایگاهی باید خود مختار باشند. خود مختاری محلی یعنی تمام عملیات داده شده به یک مانه باید توسط همان مانه کنترل شود. هیچ مانه ای نباید برای انجام درست عملیاتش به مانه ای دیگر وابسته باشد ( در غیر اینصورت اگر یک مانه از کار بیافتد عملیات مانه دیگر بطور مستقل و بدرستی انجام نمی شود ).

عدم وابستگی به یک مانه مرکزی

بر اساس خودمختاری محلی، تمام مانه ها از نظر توانش عملیاتی باید در یک سطح باشند. بنابراین هیچ وابستگی به یک مانه مرکزی برای سرویس های مرکزی – مانند پردازش درخواست متمرکزشده ، مدیریت تراکنش متمرکز شده  – وجود ندارد بطوریکه همه سیستم به آن مانه وابسته باشند. این عدم وابستگی به مانه مرکزی از خود مختاری محلی تاثیر می پذیرد.

چون خودمختاری محلی بطور کامل امکان پذیر نیست پس عدم وابستگی به مانه مرکزی هم صد در صد امکان نمی پذیرد.

استقلال از مکان ذخیره سازی

بطور ساده، منظور از استقلال داده ها از مکان ذخیره سازی که تحت عنوان پنهان سازی مکان ذخیره سازی نیز شناخته می شود،این است که کاربر نباید بداند که داده بطور فیزیکی در کجا ذخیره شده است، بعلاوه باید بتواند ]حداقل از دیدگاه منطقی[  به همان  نحوی داده ها را ببیند که همه داده ها بطور فیزیکی در مانه محلی آن ذخیره شده باشد. استقلال ازمحل ذخیره سازی داده ها، یک جنبه مطلوب به حساب می آید، زیرا عملیات در پایانه ها و برنامه های کاربران را ساده تر می کند ، خصوصاً این ویژگی، به داده ها اجازه مهاجرت یا جابجایی بین مانه ها را می دهد، بدون اینکه برنامه های کاربران نا معتبر شوند.

استقلال از چگونگی پارسازی داده ها

اگر بتوان اگر یک رابطه ذخیره شده را به قطعاتی تفکیک کرد و آن ها را در مانه های مجزا ذخیره کرد، سیستم پارسازی داده ها  را پشتیبانی می کند. پارسازی با هدف افزایش کارایی یک قابلیت مطلوب به شمار می آید. داده ها می توانند در محل هایی که بیشتر مورد استفاده قرارمی گیرند ذخیره شوند ، بنابراین بیشتر عملیات، بصورت محلی انجام می گیرد و ترافیک شبکه کاهش می یابد.

پردازش در خواست های توزیع شده

دو نکته مهمی که  در مورد این بخش باید بررسی شود در مثال زیر بیان شده است.

  • درخواست « تهیه کنندگان لندنی که قطعه قرمز رنگ تهیه کردند»را در نظر بگیرید . فرض کنید کاربر در مانه نیویورک قرار دارد و داده های مورد نیاز، بطور فیزیکی در لندن ذخیره شده اند و تعداد n تاپل جواب این در خواست باشد . اگر سیستم رابطه ای باشد ، در خواست اساساً شامل دو پیغام می شود. یکی برای ارسال در خواست از نیویورک به لندن و دیگری برای برگرداندن مجموع جواب n تاپلی از لندن به نیویورک. از طرف دیگر اگر سیستم رابطه ای نباشد اما در هر لحظه یک رکورد را پردازش کند ، در خواست ۲n پیغام را شامل می شود ، n پیغام از نیویورک به لندن برای در خواست «تاپل بعدی» و n  پیغام از لندن به نیویورک به منظور برگرداندن تهیه کننده «بعدی».

پایگاه داده های توزیع شده همگن و ناهمگن

 

 

در پایگاه داده های توزیع شده همگن، تمام مانه ها دارای نرم افزار مدیریت پایگاه داده یکسان هستند و هر مانه ضمن اطلاع از مانه های دیگر قابلیت پردازش توزیع شده درخواست کاربر را دارد. در چنین سیستمی ، هر مانه بخشی از خودمختاری خود را برای بر اساس تغییر در شمای پایگاه داده های خود از دست می دهد. این سیستم بعلاوه باید قادر به پردازش تراکنش توزیع شده باشد تا بتواند درخواست های توزیع شده را جواب دهد.

مشکلات سیستم های توزیع شده

در این بخش بطور مشروح به جزئیات برخی از مشکلات سیستم های توزیع شده پرداخته می شود. ارتباط شبکه حداقل در شبکه های گسترده محلی- LAN – نسبتاً کند است. یک شبکه گسترده – WAN- خاص ممکن است نرخ انتقال داده های  موثری در حدود ۵ تا ۱۰هزار بایت در ثانیه داشته باشد. از طرفی، یک دیسک سخت بطور معمول ، نرخ انتقال داده هایی در حدود ۵ تا ۱۰ میلیون بایت در ثانیه دارد. ( شبکه های محلی نیز نرخ انتقالی در حدود دیسک های سخت دارند ).

پردازش و بهینه سازی درخواست

پیش از بیان جزئییات بحث های پردازش درخواست و بهینه سازی پرسش ، ذکر تعریفی اجمالی از آنها ضروری به نظر می رسد.

پردازش درخواست ، فرایندی  است که بوسیله آن یک درخواست داده شده در SQL به عملگرهای سطح پائین پردازش برگردانده می شود.

تقریباً تمام DBMS های اخیر ، از SQL – زبان استاندارد درخواستها –  پشتیبانی می کنند.

بهینه سازی پرسش فرایندی است که به کمک آن بهترین استراتژی ممکن برای اجرای یک درخواست داده شده را ازبین مجموعه ای از استراتژی های ممکن انتخاب می شود.

توازی بین درخواست ها

این نوع توازی ، امکان اجرای موازی چندین ترکنش مستقل را بطور همزمان فراهم می سازد.

لازمه «توازی بین درخواست ها» و «توازی درون درخواست» در PDBMSها ، استفاده از بخش بندی داده ها است. بخش بندی داده ها درسیستم پایگاه داده های موازی شبیه پارسازی داده ها درسیستم های پایگاه داده های توزیع شده می باشد.

پروتکل های قابلیت اطمینان

همانطور که قبلاً اشاره شد ،  DBMS های توزیع شده در اساس قابلیت اطمینان بالاتری نسبت به پایگاه داده های متمرکز دارند. این برتری بدلیل وجود بیش از یک نسخه از هر مولفه ی سیستم است . چون درسیستم های متمرکز بطور معمول  مولفه ها واحد هستند ، خرابی هر مولفه ، قابلیت اطمینان و در دسترس بودن سیستم را تحت تاثیر قرار می دهد .

این ضعف درسیستم های توزیع شده تاحدودی برطرف شده است . البته این برتری به شرطی معتبر خواهد بود که پروتکل های سیستم بدرستی طراحی و پیاده سازی شوند تا در هنگام بروز خرابی قابلیت اطمینان سیستم کاهش نیابد.

خطوط اتصال پایگاه داده ها

مهم ترین و اساسی ترین مفهوم در پایگاه داده های توزیع شده «خط اتصال پایگاه داده ها» است. یک خط اتصال پایگاه داده ها، یک اتصال فیزیکی بین دو خدمتگزار پایگاه داده ها است که مشتری ها را قادر می سازد به دو پایگاه داده های بطور فیزیکی مجزا، شبیه یک پایگاه داده های منطقی دسترسی داشته باشند.

این مفهوم، اصل پنهان سازی توزیع را تا حدی پیاده سازی کرده است. در واقع به کمک خطوط اتصال پایگاه داده ها، توزیع شدگی را از دید کاربران نهایی پنهان می سازد.

توزیع داده ها

مراحل اولیه طراحی منطقی پایگاه داده های توزیع شده درست مانند پایگاه داده های متمرکز است. این بدان معناست که، در ابتدا بدون در نظر گرفتن شبکه توزیع داده ها و مستقل از مانه ها، پایگاه داده ها طراحی می شود.

پس از طراحی منطقی پایگاه داده ها بر اساس یک ساختار داده مشخص که گونه رابطه ای آن متداولتر است، باید توزیع شدگی سیستم را وارد مراحل ایجاد پایگاه داده ها نمود.

.

 

 

سفارش تحقیق
http://telegram.me/pmaghale

ارسال یک پاسخ