X
تبلیغات
رایتل

پاورپوینت مفاهیم بنیادی پایگاه داده ها

شنبه 13 آذر 1395

پاورپوینت مفاهیم بنیادی پایگاه داده ها


فهرست

مفاهیم پایگاه داده‌ها

مدلسازی معنایی داده‌ها

محدودیتهای روش ER

پایگاه داده در محیط انتزاعی

معماری پایگاه داده‌ها

سیستم مدیریت پایگاه داده‌ها

DBMS در یک سیستم کامپیوتری

معماری سیستم پایگاه داده‌ها

مدل رابطه‌ای

قواعد جامعیت پایگاه داده‌ها

زبان SQL

ادامه زبان SQL

دید در مدل رابطه‌ای

طراحی پایگاه داده‌های رابطه‌ای

نرمالترسازی رابطه‌ها

طراحی فیزیکی پایگاه داده‌ها



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

نگاهی بر داده کاوی و کشف قوانین وابستگی

دوشنبه 1 آذر 1395

نگاهی بر داده کاوی و کشف قوانین وابستگی

چکیده:

با افزایش سیستمهای کامپیوتر و گسترش تکنولوژی اطلاعات , بحث اصلی در علم کامپیوتر از چگونگی جمع آوری اطلاعات به نحوه استفاده از اطلاعات منتقل شده است . سیستمهای داده کاوی ,این امکان را به کاربر می دهند که بتواند انبوه داده های جمع آوری شده را تفسیر کنند و دانش نهفته در آن را استخراج نمایند .

داده کاوی به هر نوع کشف دانش و یا الگوی پنهان در پایگاه داده ها اطلاق می شود . امروزه داده کاوی به عنوان یکی از مهمترین مسائل هوش مصنوعی و پایگاه داده ، محققان بسیاری را به خود جذب کرده است . در این تحقیق ابتدا نگاه کلی بر داده کاوی ، استراتژیهای داده کاوی و... داریم ، سپس مسأله کشف قوانین وابستگی در پایگاه داده را به تفضیل بررسی کردیم و نگاهی به الگوریتمهای موجود برای آن داشتیم . سپس مسأله کشف قوانین وابستگی در پایگاه داده های پویا را مورد بحث قرار دادیم و الگوریتم های ارائه شده مربوطه را مطرح کردیم .


مقدمه :

هدف از این اراِئه و تحقیق بررسی روشهای مطرح داده کاوی است .داده کاوی هر نوع استخراج دانش و یا الگواز داده های موجود در پایگاه داده است که این دانشها و الگوها ضمنی و مستتر در داده ها هستند ,از داده کاوی می توان جهت امور رده بندی (Classification ) و تخمین (Estimation) ,پیش بینی (Prediction) و خوشه بندی (Clustering)استفاده کرد .داده کاوی دارای محاسن فراوانی است . از مهمترین آن محاسن کشف کردن دانش نهفته در سیستم است که به شناخت بهتر سیستم کمک می کند .به عنوان مثال می توان به استفاده ترکیبی از روش خوشه بندی جهت تخصیص بودجه به دسته های مختلف از کتب اشاره کرد .

سیستمهای داده کاوی تقریبا از اوایل دهه 1990 مورد توجه قرار گرفتند . علت این امر نیز آن بود که تا آن زمان سازمانها بیشتر در پی ایجاد سیستمهای عملیاتی کامپیوتری بودند که به وسیله آنها بتوانند داده های موجود در سازمان خود را سازماندهی کنند . پس از ایجاد این سیستمها ,روزانه حجم زیادی از اطلاعات جمع آوری میشد که تفسیر کردن آنها از عهده انسان خارج بود . به همین دلیل , نیاز به تکنیکی بود که از میان انبوه داده معنی استخراج کند و داده کاوی به همین منظور ایجاد و رشد یافت .

بنابر این هدف اصلی از داده کاوی ,کشف دانش نهفته در محیط مورد بررسی است که این دانش می تواند شکلهای گوناگونی داسته باشد . دانش استخراج شده می تواند به فرم الگوهای موجود در داده ها باشد که کشف این الگوها منجر به شناخت بهتر سیستم نیز می شود . الگوهای استخراجی عموما بیانگر روابط بین ویژگیهای سیستم هستند بعنوان مثال در سیستم تجاری یک الگو می تواند بیانگر رابطه بین نوع کالا و میزان تقاضای آن باشد .

در این تحقیق داده کاوی مورد بحث قرار می گیرد . علل استفاده از داده کاوی و منابعی که داده کاوی بر روی آنها اعمال می شود ,علاوه بر این خلاصه ای از روشهای رایج داده کاوی ارائه شده است . تکنیکهای داده کاوی و قوانین وابستگی و الگوریتمهای موجود (Apriori , Aprior TID, Partition, Eclat ,Max Eclat , Vector ) و الگوریتم با ساختار Trie وfp grow و الگوریتمهای کاهشی مورد بررسی قرار می گیرند و در هر مورد مثالها , موارد کاربرد ,تکنیکها و نقاط قوت و ضعف مورد بررسی قرار گرفته اند .



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

نگاشت تراکنش های پایگاه داده شی گرا به تراکنش های رابطه ای

دوشنبه 1 آذر 1395

نگاشت تراکنش های پایگاه داده شی گرا به تراکنش های رابطه ای

در اکثر پروژه­های کامپیوتری انجام شده در دهه­های اخیر از تکنولوژی­های تمام شئ­گرایی مانند Java و C# استفاده شده در حالی که برای ذخیره سازی داده­ها از پایگاه­داده­های رابطه­ای که در آنها اثری از شئ­گرایی موجود نیست استفاده شده. این بدین معنا نیست که انتخاب­های دیگری موجود نیست بلکه بسیاری زبان­های برنامه­نویسی Procedural شبیه COBOL موجود است همچنین بسیاری از پایگاه­داده­های موجود از تکنولوژی شئ­گرا بهره می­برند از جمله می­توان از پایگاه­داده­های XML نام برد.

بین تکنولوژی­های شئ­گرایی و رابطه­ای که اکثر تیم­های نرم­افزاری در سیستم­های خود به­کار می­برند یک ناهم­خوانی ذاتی موجود است. برای رفع این ناهمخوانی یک راه ساده وجود دارد که از دو بخش تشکیل شده: ابتدا باید پروسه­ی نگاشت اشیاء به رابطه­های پایگاه­داده را آموخت و سپس روشی برای پیاده­سازی آن فرا گرفت.



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

نحوه ارسال داده ها به شبکه

یکشنبه 30 آبان 1395

نحوه ارسال داده ها به شبکه

این مقاله مفاهیم بسته های اطلاعاتی را به عنوان اجزاء اصلی ارتباطات شبکه شرح داده و به شما یک دید کلی در مورد مطالب زیر می دهد:

ـ نقش و اهمیت بسته های اطلاعاتی در ارتباطات شبکه

ـ بخشهای اصلی یک بسته اطلاعاتی

ـ منشأ و آرایش بسته های اطلاعاتی

ـ نحوه ارسال و دریافت بسته های اطلاعاتی

ـ نحوه اتصال بسته های اطلاعاتی به یکدیگر جهت تکمیل ارسال داده ها

هدفها :

در پایان این مقاله شما می توانید:

ـ واژه بسته اطلاعاتی و وظیفه آن را تعریف کنید و اجزاء آن را نام ببرید.

ـ وظیفه و محتویات هر یک از اجزاء بسته اطلاعاتی شامل: هدر، داده ها و تریلر را شرح دهید.

ـ نحوه ارسال بسته های اطلاعاتی را در طول شبکه شرح دهید.

این درس حدود 35 دقیقه طول می کشد.

وظیفه بسته های اطلاعاتی در ارتباطات شبکه :

داده ها اغلب به صورت فایل های بزرگ هستند. اگر کامپیوتری در یک لحظه بسته اطلاعاتی بزرگی را در کابل قرار دهد، شبکه برای مدتی نمی تواند کار کند و به دو دلیل کند خواهد شد.

اول آنکه، کابل به دلیل ورود حجم زیادی از داده ها در آن به شدت اشغال می شود و برای مدتی امکان ارتباط غیرممکن خواهد شد.

دلیل دوم اینکه شبکه بلوک های بزرگ داده را به بسته های کوچکتر تقسیم می کند، بدین علت که اگر هنگام انتقافل اشکالی رخ داد، فقط یک بسته اطلاعاتی کوچک آسیب می بیند و تنها همان بسته باید دوباره ارسال شود نه تمام اطلاعات، به این ترتیب تصحیح خطا بسیار سریعتر و آسانتر انجام خواهد شد.



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید
برچسب‌ها: نحوه، ارسال، داده، شبکه

مقدمه ای بر داده کاوی (درس پایگاه داده های پیشرفته 2)

یکشنبه 30 آبان 1395

مقدمه ای بر داده کاوی (درس پایگاه داده های پیشرفته 2)


1 مقدمه ای بر داده‌کاوی:

در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند.

بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. این رشد انفجاری در داده‌های ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.

داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش، حصول دانش، بازیابی اطلاعات، محاسبات سرعت بالا و بازنمایی بصری داده . داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد.

فهرست:

1 مقدمه ای بر داده‌کاوی... 3

1-1 چه چیزی سبب پیدایش داده کاوی شده است؟. 4

1-2 مراحل کشف دانش.... 6

1-3 جایگاه داده کاوی در میان علوم مختلف... 11

1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟. 12

1-5 داده کاوی و انبار داده ها 13

1-6 داده کاوی و OLAP. 14

1-7 کاربرد یادگیری ماشین و آمار در داده کاوی... 15

2- توصیف داده ها در داده کاوی... 15

2-1 خلاصه سازی و به تصویر در آوردن داده ها 15

2-2 خوشه بندی 16

2-3 تحلیل لینک... 16

3- مدل های پیش بینی داده ها 17

3-1 Classification. 17

3-2 Regression. 17

3-3 Time series. 18

4 مدل ها و الگوریتم های داده کاوی... 18

4-1 شبکه های عصبی 18

4-2 Decision trees. 22

4-3 Multivariate Adaptive Regression Splines(MARS). 24

4-4 Rule induction. 25

4-5 K-nearest neibour and memory-based reansoning(MBR). 26

4-6 رگرسیون منطقی... 27

4-7 تحلیل تفکیکی 27

4-8 مدل افزودنی کلی (GAM). 28

4-9 Boosting. 28

5 سلسله مراتب انتخابها 29



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

امنیت پایگاه داده ( سرور)

شنبه 29 آبان 1395

امنیت پایگاه داده ( سرور)

اشاره :

مقوله امنیت همواره یکی از مهم‌ترین شاخه‌های مهندسی نرم‌افزار و به تبع آن، یکی از حساس‌ترین وظایف مدیران سیستم به‌خصوص مدیران شبکه و یا مدیران بانک‌های اطلاعاتی است. با تنظیم سطوح دسترسی برای کاربران شبکه یا بانک‌های اطلاعاتی شبکه، امنیت اطلاعات یا به عبارتی عدم دسترسی افراد فاقد صلاحیت به اطلاعات، تضمین می‌گردد.

هر سیستم‌عامل، پلتفرم یا بانک اطلاعاتی، شیوه‌هایی خاصی را برای برقراری قواعد امنیتی به کاربران معرفی می‌نماید. در SQL Server هم روش‌های خاصی برای این مقوله وجود دارد که در اینجا به آن‌ها می‌پردازیم



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید
برچسب‌ها: امنیت، پایگاه، داده، سرور)

الگوریتم های تخصیص داده پویا در سیستم های پایگاه داده توزیعی

شنبه 29 آبان 1395

الگوریتم های تخصیص داده پویا در سیستم های پایگاه داده توزیعی

مقدمه:

پیشرفت در تکنولوژیهای شبکه و پایگاه داده در دهه های اخیر منجر به ایجاد سیستم های پایگاه داده توزیع شده گشته است .یک سیستم پایگاه داده توزیع شده مجموعه ای از سایتها می باشد که از طریق شبکه به هم متصل شده اند که هر کدام از سایت ها پایگاه داده مخصوص به خود دارد اما می توانند با یکدیگر کار کنند بنابراین هر کاربری در هر سایتی می تواند به همه داده های موجود در شبکه دسترسی داشته باشد درست مانند اینکه همه داده ها در سایت کاربر ذخیره شده است .

دغدغه اصلی سیستم های پایگاه داده توزیع شده قطعه قطعه کردن و تخصیص پایگاه داده اصلی می باشد واحد قطعه داده می تواند یک فایل باشد که در این حالت موضوع تخصیص همان تخصیص فایل خواهد بود مشکل تخصیص داده یک مسئله NP-complete می باشد بنابراین نیاز به هیوریستیکهای سریع برای تولید راه حل های موثر می باشد علاوه بر اینها تخصیص بهینه اشیا پایگاه داده به طور شدید بستگی به استراتژی اجرای پرس وجو که به وسیله پایگاه داده توزیع شده پیاده سازی شده دارد .

هزینه اصلی در اجرای پرس و جو در سیستمهای پایگاه داده توزیع شده هزینه انتقال داده هنگام انتقال یک رابطه در موقع درخواست پرس و جو از یک سایت و انتقال آن از یک سایت متفاوت می باشد . هدف اصلی الگوریتم های تخصیص داده تعیین نسبت دادن فرگمنتها به سایتهای مختلف برای کمینه کردن هزینه انتقال داده در اجرای یک مجموعه از پرس و جو ها می باشد که معادل کمینه کردن زمان متوسط اجرای پرس و جو می باشد که اهمیت اصلی در محیط های توزیع شده و پایگاه داده چند رسانه ای دارد .




خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

پاورپوینت نگاشت تراکنش های پایگاه داده شی گرا به تراکنش های رابطه ای

شنبه 29 آبان 1395

پاورپوینت نگاشت تراکنش های پایگاه داده شی گرا به تراکنش های رابطه ای

اعمال اولیه برای نگاشت بین مدل رابطه ای و شئ گرا:

نگاشت

هدف اصلی یافتن یک استراتژی مناسب و کارا برای نگاهداری داده های اشیاء است. این کار شامل ذخیره کردن صفات و رابطه های بین اشیاء از جمله رابطه ارث بری میان اشیاء است.

پیاده سازی نگاشت

یکسان ساختن کارایی




خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

پاورپوینت ساختمان داده ها و الگوریتم (1)

شنبه 29 آبان 1395

پاورپوینت ساختمان داده ها و الگوریتم (1)

در مورد ساختمان داده:

ساختمان داده روشی است برای معرفی و دستکاری داده

و کلیه برنامه های معرفی داده

برای معرفی داده نیازمند یک الگوریتم میباشد.

روش های طراحی الگوریتم نیازمند پیشرفت برنامه هایی است که برای نگهداری داده است.

در علوم کامپیوتر مطالعه ساختمان داده ها مهم وضروری میبا شد.


Perequisites:

C++

پیچیدگی

Big oh , theta and omega notation


Sorting:

ترتیب زیر را در نظر بگیرید:

a[0],a[1],…, a[n-1]

پس از مرتب سازی صعودی داریم:

a[0] <=a[1]><=><>

example:8,6,9,4,3 => 3,4,6,8,9



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

پاورپوینت ساختمان داده ها به زبان C

شنبه 29 آبان 1395

پاورپوینت ساختمان داده ها به زبان C


فصل اول : مفاهیم اساسی

اهداف:

آشنایی با سیکل زندگی نرم افزار

آشنایی با الگوریتم


1-1 سیکل زندگی نرم افزار-نیازمندی ها:

نیازمندیها

تمام پروژه های بزرگ برنامه نویسی با مجموعه ای از مشخصات و خصوصیاتی که اهداف پروژه را مشخص می کند، شروع می شود.

این نیازمندیها اطلاعاتی را به برنامه نویسان می دهند(ورودی) و نیز نتایجی را که باید ایجاد گردد(خروجی) تعیین می کنند.


فهرست:

فصل اول : مفاهیم اساسی

فصل دوم : آرایه ها

فصل سوم : صف و پشته

فصل چهارم: لیست ها

فصل پنجم : درخت

فصل ششم: گراف ها

فصل هفتم: مرتب سازی



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید
برچسب‌ها: پاورپوینت، ساختمان، داده، زبان، C

پاورپوینت ساختمان داده و الگوریتم

شنبه 29 آبان 1395

پاورپوینت ساختمان داده و الگوریتم

سرفصل‌ها :

1- مفاهیم: زمان اجرا، الگوریتم‌ها، بازگشتی.

2- آرایه‌ها و ماتریس‌ها

3- پشته و صف

4- اشاره‌گرها و لیست‌های پیوندی

5- کاربرد سیستم‌های پیوندی

6- درخت‌ها

7- گراف‌ها

8- مرتب سازی و جستجو


فصل اول: مفاهیم ساختمان داده و الگوریتم


مهندسی نرم افزار: بررسی، تعریف و طراحی و پیاده سازی و پشتیبانی نرم افزارهای کامپیوتری را گویند.

برنامه‌ها: داده‌ها الگوریتم‌ها

با توجه به تعریف مهندس نرم افزار نتیجه می‌گیریم که وظیفه اصلی مهندسی نرم افزار طراحی و پیاده سازی برنامه‌های مناسب و پشتیبانی آنها می‌باشد.

تعریف داده: مقدار یا مجموعه‌ای از مقادیر را اصطلاحاً گویند.

ساختمان داده: یک مدل منطقی یا ریاضی برای نگهداری و نمایش داده‌ها را گویند.

ویژگی‌های یک ساختمان داده مناسب:

1- سادگی: به این معناست که بتوانیم برای ساختمان داده مورد نظر الگوریتم‌های ساده‌ای را طراحی کنیم.

2- استغنا (بی‌نیازی): هر قدر که ساختمان داده مورد نظر بتواند به دنیای واقعی نزدیک باشد استغنای آن بیشتر است.

الگوریتم: مجموعه دستورالعمل‌هایی که با اجرای گام به گام آن‌ها هدف خاصی دنبال می‌شود.



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

پاورپوینت تکنیک های ترمیم فجایع در سیستم های پایگاه داده

شنبه 29 آبان 1395

پاورپوینت تکنیک های ترمیم فجایع در سیستم های پایگاه داده

مقدمه:

پایگاه داده ها بالقوه در معرض آسیب است. انواع نقص (عیب) و در نتیجه خرابی ممکن است در پایگاه داده ها بروز کند.

سیستم مدیریت پایگاه داده ها باید بتواند, در صورت بروز خرابی, پایگاه داده ها را ترمیم و آسیبها و خسارات وارده بر آن را جبران کند.


تعریف ترمیم:

بازگرداندن پایگاه داده ها به وضع سازگاری که درست قبل از بروز خرابی داشت. به بیان دیگر به آخرین وضع سازگار, به گونه ای که اثری از خرابی در آن نباشد.



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

پاورپوینت الگوریتم های تخصیص داده پویا در سیستم های پایگاه داده توزیعی

شنبه 29 آبان 1395

پاورپوینت الگوریتم های تخصیص داده پویا در سیستم های پایگاه داده توزیعی

مقدمه:

دغدغه اصلی سیستم های پایگاه داده توزیع شده قطعه قطعه کردن و تخصیص پایگاه داده اصلی می باشد واحد قطعه داده می تواند یک فایل باشد که در این حالت موضوع تخصیص همان تخصیص فایل خواهد بود مشکل تخصیص داده یک مسئله NP-complete می باشد نیاز به هیوریستیکهای سریع برای تولید راه حل های موثر می باشد §تخصیص بهینه اشیا پایگاه داده به طور شدید بستگی به استراتژی اجرای پرس وجو که به وسیله پایگاه داده توزیع شده پیاده سازی شده دارد.


فهرست مطالب:

مقدمه

الگوریتم های استاتیک

الگوریتم ژنتیک

الگوریتم Simulated Evolution

الگوریتم The Mean Field Annealing (MFA)

الگوریتم تخصیص داده جستجوی تصادفی همسایگی


الگوریتمهای تخصیص پویا

الگوریتم شمارنده ساده

الگوریتم Load Sensitive counter

الگوریتم Incremental

الگوریتم optimal

الگوریتم Threshold




خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

پاورپوینت لایه اتصال داده ها (Data Link Layer)

شنبه 29 آبان 1395

پاورپوینت لایه اتصال داده ها (Data Link Layer)

وظایف کلی این لایه:
قاب بندی(Framming)
کنترل خطاهای انتقال
کنترل جریان(تنظیم سرعت فرستنده و گیرنده)
کنترل دستیابی به خط(Mac)
خدمات این لایه می تواند ”اتصال گرا“ یا ”بدون اتصال“ باشد.

قاب بندی(Framing):

برای کنترل خطا لازم است بیتها در قالب ”قاب“ باشد.

قاب بندی، شکستن جریان بیتی به قابهای مجزا و محاسبه سرجمع برای هر یک است.

کنترل خطا با استفاده از سرجمع روی هر قاب انجام می شود.

روشهای قاب بندی:

درج فواصل زمانی

فوق العاده پر خطا و نامطمئن

ارسال طول قاب در ابتدای قاب(بر حسب بایت)

با خطا دار شدن شمارنده، کل قابهای بعدی جابجا می شوند.

استفاده از کارکترهای خاص برای شروع و پایان

ممکن است کارکترهای مرزی، در متن وجود داشته با شند.

راه حل استفاده از Character stuffing

طول قاب ضریبی از بایت است.



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید

بررسی انبار داده

شنبه 29 آبان 1395

بررسی انبار داده


مقدمه: سیر تحول

منشاء اصلی پردازش DSS به روزهای خیلی دور در تاریخ سیستمهای کامپیوتری و اطلاعاتی بر می‌گردد. جالب است بدانیم که سیستمهای پشتیبان تصمیم دارای قدمت طولانی وپیچیده در تکنولوژی اطلاعاتی است.و سیر تحول آن تا به امروز ادامه داشته است .]3[

درحدود دهه1960 جهان کامپیوتر موفق به‌ایجاد نرم افزارهایی شد که با استفاده از فایلهای Master اجرا می‌شدند.این نرم افزارها در قالب برنامه ها و گزارشاتی بودند‌‌‌‌‌‌‌‌‌‌‌، که معمولاٌ به زبان COBOL نوشته می‌شد. پانچ کارتها یک ابزار ذخیر سازی عمومی به حساب می‌آمدند. فایلهای Master توسط نوارهای مغناطیسیی نگهداری می‌شدند که برای ذخیره سازی ارزان قیمت حجم زیادی از داده مناسب بودند، اما بخاطر‌اینکه دسترسی به اطلاعات می‌بایست به صورت متوالی باشد‌این روش زیاد مفید نبود. در یک گذار در فایل نوار مغناطیسی که از100% رکوردها عبور می‌شود، عموما فقط 5 درصد ازاین رکوردها یا حتی کمتر مورد نظر بودند. بعلاوه بسته به داده درون فایل و پردازشی که باید روی آن انجام می‌شد، دسترسی به فایل نوار ورودی بیشتر از 20 تا 30 دقیقه به طول می‌انجامید.]3[


در اواسط دهه 1960، به طور گسترده‌ای رشد استفاده از فایلهای Master و نوار مغناطیسی افزایش یافتند و در پی آن مقادیر هنگفتی داده افزونه نیز به وجود آمد. ازدیاد فایل Master و داده افزونه منجر به بروز چندین مشکل شد:]3[

- نیاز به داده همزمان به محض عمل به روز رسانی

- پیچیدگی نگهداری برنامه ها

- پیچیدگی‌ایجاد برنامه‌های جدید

- نیاز به سخت افزار گران برای پشتیبانی کلیه فایلهای Master

جالب است که اگر فقط ابزار ذخیره سازی داده، نوار مغناطیسی باشد، جهان پردازش اطلاعات شاهد هیچ پیشرفتی نبود، . اگر هرگز چیزی برای ذخیره داده حجیم به وجود نمی آمد، سیستمهای سریع و خیلی بزرگ درجهان ظاهر نمی‌‌شد، ونیز هرگز سیستمهای ATM و شبیه آن به وجود نمی‌‌آمد. حقیقتا، اگر قابلیت ذخیره سازی و مدیریت داده در انواع جدید ابزارهای ذخیره سازی وجود نداشت، هرگز بستر لازم برای همکاری تکنسینها و تجار با هم به وجود نمی آمد.]3[

2-1 1-2 ظهور DASD

در 1970 تقریبا هر روز یک تکنولوژی جدید برای ذخیره سازی و دسترسی داده به وجود می‌آمد.در دهه 1970 زمان تحول وسیله ذخیره سازی دستیابی مستقیم (DASD )بود. دیسک ذخیره سازی اصولا با نوار مغناطیسی از نظر قابلیت دسترسی مستقیم تفاوت داشت. ونیازی نبود که رکوردها 1,2,…,n تا n+1 رکورد مرور شود.]3[

آدرس رکورد n+1 ام شناخته شده بود، موضوع ساده‌ای بود که بفهمیم رکورد n+1 ام دقیقا در کجای دیسک قرار دارد. از‌این گذشته، زمان مورد نیاز برای دسترسی به رکورد n+1 ام، کمتر از زمان مورد نیاز برای مرور یک نوار بود. در حقیقت زمان مورد نیاز برای قرار دادن یک رکورد در DASD فقط به اندازه چند میلی ثانیه بود.]3[

به همراه DASD نوع جدیدی از نرم افزارها تولید شد که به عنوان یک سیستم مدیریت

بانک اطلاعاتی مطرح گردید. هدف از ساخت DBMS بدین منظور بود که برای برنامه نویسان ذخیره سازی و دستیابی داده در محیطDASD آسان گردد.به علاوه‌این ابزار، عملیات مختلفی را برای ذخیره سازی داده در DASD، از جمله فهرست گذاری داده و غیره راانجام می‌داد. از طریق DASD وDBMSیک راه حل تکنیکی برای حل مشکلات فایلهای Master پدید آمد.وهمچنین موضوع بانک اطلاعاتی مطرح شد.با وجود آشفتگی که فایلهای Master‌ایجاد کرده بودند و داده افزونه جمع آوری شده از آنها بسیارزیاد بود، بدین سبب عجیب نبود که در دهه 1970 بانک اطلاعاتی تعریف شده به عنوان یک منبع مجزای داده برای کلیه پردازشها مورد استفاده قرار گیرد.]3[

دراواسط دهه 1970 پردازش تراکنش بر خط (OLTP) دسترسی سریعتر به داده را امکان پذیر ساخت. باباز شدن کلیه چشم اندازهای جدید برای تجارت و پردازش، اکنون کامپیوتر می‌تواند برای انجام اعمالی که قبلا غیر ممکن به نظر می‌رسید، مثل سیستمهای رزور درایو، سیستمهای پاسخگوی بانک، سیستمهای کنترل ساخت و مانند آن مورد استفاده قرار گیرد.اگر دنیا در مرحله استفاده از فایل نوار مغناطیسی باقی می‌ماند، ساخت بیشتر سیستمهایی که امروزه تولید می‌شود امکان پذیر نبود.]3[

3-1 تکنولوژی زبانهای نسل چهارم وکامپیوترهای شخصی

در دهه 1980 اکثر تکنولوژیهای جدید، مثل کامپیوترهای شخصی و زبانهای نسل چهارم، شروع به فعالیت نمودند.کاربر نهایی نقش جدی را به عهده گرفت- کنترل مستقیم داده و سیستم – که نقش قبلی رزرو شده برای پردازنده داده بود. از طریق کامپیوترهای شخصی و زبانهای نسل چهارم موقعیتی پیش آمد که کاربر بیشتر می‌توانست با داده درپردازش تراکنشهای بر خط ارتباط برقرار کند. MIS (سیستمهای اطلاعات مدیریتی)، همانطور که قبلا به کار می‌رفت، می‌توانست پیاده سازی شود. امروزه همانطور که سیستمهای پشتیبان تصمیم شناخته شدند، سیستمهای اطلاعات مدیریتی نیز برای تصمیمهای مدیریتی استفاده شدند.در گذشته داده و تکنولوژی با هم استفاده می‌شد تا تصمیمات عملیاتی جزئی اتخاذ شود.اما هیچ بانک اطلاعاتی نمی‌‌تواند هم پردازش تراکنش عملیاتی و هم پردازش تحلیلی را در یک زمان انجام دهد.شکل 1-1 نمونه‌ای از بانک اطلاعاتی را نشان می‌دهد.]3[



-4-2-3 OCI و نرم افزارهای مسیر مستقیم

این امکان زمانی مورد استفاده قرار می‌گیرد که تغییر شکل داده ای و محاسبات روی داده خارج ازبانک اطلاعاتی انجام می‌شود و نیازی به استفاده از فایلهای Flat نیست. [6]

3-4-2-4 Export/Import

از این امکان زمانی استفاده می‌شود که داده باید مستقیماً درسیستم مقصد اضافه می‌شود. استفاده از این امکان روی مقادیر زیاد داده‌ای نباید به کار رود و دراستخراجهای پیچیده ممکن نیست. [6]

به دلیل استفاده از بانکهای همگن در این پروژه به بحث و بررسی مکانیزمهای دگرگونی داده پرداخته نمی‌شود ولی لازم به ذکر است که مکانیزمهای تغییر شکلهای داده ای درون بانک اطلاعاتی یکی از روشهای زیر می‌تواند باشد: [6]

- تغییر شکل داده ای با استفاده از SQL

- تغییر شکل داده ای از طریق PL /SQL

- تغییر شکل داده ای با استفاده از توابع جدولی

در بخش قبل در مورد روشهای مختلف انتقال داده (ETL) از منابع اطلاعاتی به درون محیط انبار داده بحث و بررسی شد. در این بخش قصد داریم به بررسی طراحی کلی محیط انبار داده و پیکر بندی آن و ایجاد بستر مناسب جهت انتقال داده درون انبار داده بحث و بررسی کنیم. لازم به ذکر است به جهت گستردگی بحث انبار داده، تنها به بررسی حالت خاص پیکر بندی انبار داده یعنی بانکها و منابع اطلاعاتی کاملاً همگن می‌پردازیم. [6]

مروری بر کپی سازی داده (Replication)

پردازش Replication ، عمل کپی و نگهداری اشیاء بانک اطلاعاتی مثل جداول در چندین بانک اطلاعاتی است که یک سیستم بانک اطلاعاتی توزیع شده را ایجاد می‌کند. تغییرات داده ای انجام شده در یک سایت به صورت محلی قبل از ارسال و قرار گیری در مکانهای Remote، ذخیره می‌شود.پردازش Replication در اوراکل یک ویژگی درونی شده درOracle Server است؛ و یک سرویس دهنده جداگانه‌ نیست. [6]

پردازش Replication در تکنولوژی بانک اطلاعاتی توزیع شده استفاده می‌شود تا داده را بین چندین سایت به اشتراک گذارد. اما یک پایگاه داده کپی سازی شده و یک بانک اطلاعاتی توزیع شده یکسان نیستند. در یک بانک اطلاعاتی توزیع شده ، داده در چندین مکان وجود دارد، اما یک جدول خاص فقط در یک مکان قرار دارد. برای مثال جدول Person فقط در بانک اطلاعاتی شماره 1 در یک سیستم بانک اطلاعاتی توزیع شده قرار دارد که شامل بانکهای اطلاعاتی شماره 2و3 نیز هست. کپی سازی یعنی همان داده در چندین مکان موجود است. برای مثال جدول Person در بانکهای اطلاعاتی شماره1، شماره2 و شماره 3 موجود است. [6]

بعضی دلایل ‌کاربرد کپی سازی به شرح زیر است:

- دردسترس بودن

کپی سازی قابلیت استفاده از نرم افزار را بالا می‌برد، چرا که ویژگی دسترسی جایگزینی را برای داده فراهم می‌کند. اگر یک سایت آماده یا دردسترس نباشد، پس کاربران پرسجوهای خود را به مکانهای باقیمانده ارسال می‌کنند. به بیان دیگر،پردازش کپی سازی پشتیبانی از اطلاعات را در زمان از کارافتادگی یک یا چند سیستم ارائه می‌کند. [6]

- کارایی

پردازش کپی سازی قابلیت دستیابی محلی و سریع را به داده مشترک ایجاد می‌کند. چرا که تعادل انجام فعالیتها را در چندین سایت برقرار می‌کند. بعضی کاربران می‌تواند به یک سرور در حالی دسترسی داشته باشد که سایر کاربران به سرورهای دیگر دسترسی دارند، که در نتیجه باراضافی در کلیه سرورها کاهش می یابد. همچنین کاربران می‌توانند به داده از سایت Replication دسترسی یابند که کمترین هزینه دسترسی را دارد، که عموماً همان سایتی است که به صورت جغرافیایی نزدیکترین فاصله مکانی را به آنها دارد. [6]

- انجام عملیات روی داده بدون اتصال به بانک اطلاعاتی اصلی

یکMaterialized view درواقع یک کپی کامل یا جزئی (Replica)‌ از یک جدول مورد نظر در یک لحظه خاص از زمان است. Materialized view‌ها این قابلیت را به کاربران می‌دهد که در یک زیر مجموعه از یک بانک اطلاعاتی کار کنند که می‌تواند به سرور بانک اطلاعاتی مرکزی متصل نباشد. سپس وقتی اتصال برقرار شد، کاربران می‌توانند در صورت نیازMaterialized view ها را Refresh کنند. وقتی کاربران Materialized view ‌ها را Refresh می کنند، بانک اطلاعاتی مرکزی را با کلیه تغییراتش به روز رسانی می‌کنند و هر تغییر که در زمان قطع اتصال اتفاق افتاده است را دریافت می‌کنند. [6]

- کاهش بار شبکه‌

پردازش کپی سازی می‌تواند برای توزیع داده در چندین مکان مورد استفاده قرار گیرد. در نتیجه ، نرم افزارها می‌توانند به سرورهای مناطق مختلف به جای یک سرور مرکزی دسترسی یابند. این پیکر بندی در واقع می‌تواند بار شبکه را کاهش ‌دهد. [6]

- توسعه انبوه

باتوسعه روزافزون، سازمانها نیاز به توسعه نرم افزارهایی دارند که احتیاح به قابلیت استفاده و اصلاح داده دارند. از طریق روش کپی سازی Oracle، و گزینه‌های مختلف توسعه پذیری ، ایجاد سریع محیطهای Materialized view ممکن است. می‌توان از متغییرهایی استفاده کرد تا هر محیط Materialized view برای یک کاربرد خاص خود سفارشی سازی شود. در این مورد، می‌توان به عنوان مثال شامل متغییرهایی برای نواحی فروش و فروشنده‌های مختلف را نام برد. [6]

انجام توابع ETL به معنی اجرای کد تولید شده در بانک اطلاعاتی است.این امر می تواند با استفاده از مدیر ساخت Warehouse builder یا از طریق ابزار خارجی مثل Enterprise manager انجام شود.در نهایت پردازش ETL داده منبع را به درون بانک اطلاعاتی مقصد منتقل می کند.این داده می تواند ناحیه staging ،یک ذخیره داده عملیاتی،یک انبارداده یا هر شمای دیگر باشد. بخشهای کد خارجی از بانک اطلاعاتی Oracle در محیط مربوط به خود اجرا می شوند. [6]

به منظور گزارشگیری از بارگذاری داده، کد تولید شده توسط OWB باید شامل روالها ی بازبینی باشد. این روالها اطلاعات بارگذاری را به درون جداول runtime نرم افزار OWB ثبت می کنند. اطلاعات به دست آمده در حال اجرای کد می تواند شامل تعداد سطور انتخاب شده ، اضافه شده و به روز رسانی شده است. اگر مشکلی حین تبدیل یا بارگذاری داده رخ دهد ، گزارش روال بازبینی مشکل جداول را مشخص می کند. به منظور دسترسی آسانتر و گزارشگیری ساده از این اطلاعات runtime ، OWB محیط مرورگر بازبینی زمان اجرا را فراهم ساخته است. [6]

5-3 راهکار مجتمع Oracle Warehouse Builder

ایجاد یک نرم افزار هوشمند تجاری یک پردازش پیچیده می باشد. مراجل و فازهای مختلفی درگیر می باشد، که ممکن است ظرفیت تهداد زیادی از سیستمها ، منابع، و نواحی عملکردی را بگیرد. OWB این گونه پیچیدگیها را به منظور حصول به یک نرم افزار مجزا با در نظر گرفتن موارد مقیاس پذیری ، قابلیت اطمینان و انعطاف پذیری آن کاهش می دهد. عمده قابلیتهای OWB شامل موارد زیر می باشد:

- تعریف import داده منبع

- طراحی و ایجاد شمای بانک اطلاعاتی هدف

- تعریف انتفال و تبدیل داده بین سیستم مبدا و مقصد

- تعیین وابستگیهای بین پردازشهای ETL

- مدیریت و به روز رسانی تعاریف داده

- گسترش، به روز رسانی، و مدیریت شماهای هدف

- طراحی و ایجاد محیط بازیابی موردی

- طراحی و ایجاد یک محیط OLAP

5-4 تعریف اشیاء

پس از جمع آوری نیازمندیهای انباره داده یا data mart ، آماده طراحی سیستم مورد نظر در warehouse builder هستیم.اکثر مدلسازیها در ماجول انباره داده قرارمی گیرد . در این بخش قصد داریم نحوه ایجاد ماجول انباره داده و اشیاء آن را ارائه کنیم. [6]



خرید فایل



برای دیدن ادامه مطلب اینجا را کلیک کنید
برچسب‌ها: بررسی، انبار، داده
( تعداد کل: 159 )
   1       2       3       4       5       ...       11    >>