بررسی data warehouse

بررسی انباره داده بخش چهارم

  توصيف محيط معماری

سطوح طبيعي تفکيک داده دليل اصلی تفاوت بين داده ابتدايي و مشتق شده را در شكل زیر نشان مي‌‌دهد.
انباره داده

چهار سطح داده در محيط معماري وجود دارد كه عبارتند از: سطح عملياتي، سطح اتوميك يا انبار داده، دپارتمان (يا سطح Data Mart) و سطح فردی.‌اين سطوح مختلف داده مبناي يك معماري بزرگ هستند كه کارخانه اطلاعات سازمان گفته مي‌شوند. سطح عملياتي داده فقط داده ابتدايي بر مبناي نرم افزار را نگهداري مي‌كند و اصولا مجموعه پردازش تراكنش با كارايي بالا را سرويس مي‌دهد. سطح انبار داده، داده مجتمع شده را نگهداري مي‌كند، داده ابتدايي تاريخ داری كه نمي‌‌تواند به روز رساني شود. به علاوه بعضي داده‌هاي مشتق شده هم در آن پيدا مي‌شود. سطح دپارتمان يا Data Mart داده، که از طريق نيازمنديهاي كاربرنهاي در يك قالب كار آمد خاص برای نيازهاي دپارتمان شکل مي‌گيرد. و در آخر سطح فردی داده جايي است كه بيشتر تحليلهای کشف کننده در آن انجام مي‌گيرد.
سطوح مختلف داده از مجموعه بالاتری از موجوديتهای معماري تشکيل مي‌شود.اين موجوديتها کارخانه اطلاعات سازمان را تشکيل مي‌دهد. بعضي مردم عقيده دارند محيط معماری داده افزونه زيادي توليد مي‌كند. به هر جهت در نگاه اول بديهی نيست، اما‌اين تمام موضوع نيست. در عوض محيط وب است كه مقاديرانبوهی از داده افزونه‌ايجاد مي‌كند.
 در سطح عملياتي يك ركورد براي مشتري به نام J,Jonesوجود دارد. ركورد سطح عملياتي حاوی مقدار جاري داده است كه مي‌تواند در يك لحظه به روز رساني شود و موقعيت جاري مشتري را نشان دهد. البته اگر اطلاعات Jones عوض شود ركورد سطح عملياتي تغيير داده خواهد شد تا روی داده جاری تاثير بگذارد.
محيط انبار داده حاوی رکورد‌های زيادی مربوط به Jones است كه تاريخ اطلاعات مربوط به وی رانشان مي‌دهد. براي نمونه انبار داده براي استخراج محل زندگی Jones در سال گذشته جستجو مي‌شود. بين ركوردهاي محيط عملياتي كه اطلاعات جاري را نگهداري مي‌كند و محيط انبار داده كه داده اطلاعات تاريخ دار را نگهداري مي‌کند، هيچگونه تکراری وجود ندارد. اگر يك تغيير آدرس براي Jones وجود داشته باشد پس يك ركورد جديد در انبار داده‌ايجاد مي‌شود يعني از تا تاريخ خاص Jones در آدرس قبلي زندگي مي‌كرده است.توجه كنيد كه ركوردها در انبارداده برخوردی از نظر تکراری شدن ندارند. همچنين توجه كنيد كه بعضي عناصر زماني در يك ركورد انبارداده مي‌تواند وجود دارد.
محيط دپارتمان (گاهي سطح Data Mart ، سطح OLAP يا سطح DBMS چند بعدي گفته مي‌شود) حاوي اطلاعات مورد استفاده دپارتمانهای بخشهای مختلف يك سازمان است. يك بانك اطلاعاتي دپارتمان فروشگاه، يك بانك اطلاعات دپارتمان حسابداري، يك بانك اطلاعاتي دپارتمان آمار و غيره مي‌تواند از ‌اين نوع باشد.
انبارداده منبع کليه داده‌های دپارتماني است. در حاليكه داده در Data Mart مطمئنا با داده در سطح عملياتي يا انبارداده ارتباط دارد، داده درون يک محيط دپارتماني يا Data Mart اصولا از داده در محيط Data Mart ديگر متفاوت است. چرا كه داده Data Mart با توجه به نيازهاي عملياتي يك دپارتمان خاص غير نرمال، خلاصه شده و با ساختار خاص ارائه مي‌گردد.
انباره داده

داده نمونه در سطح دپارتماني/ Data Mart يك فايل ماهانه مشتري است. در فايل يك ليست از مشتريان با دسته بندي وجود دارد. Jones هر ماه به همراه ساير مشتريان در‌اين گروهها قرار داده مي‌شود.‌اين مورديک بسط داده براي توصيف تطبيق اطلاعات است که افزونه شده اند.
سطح آخر داده سطح فردی است. داده فردی معمولا داده كوچك و موقتی است. بيشتر تحليلهای کاشف اطلاعات در سطح فردی انجام مي‌شود، بر طبق قاعده، سطوح فردی داده به وسيله Pc پشتيباني مي‌شوند .پردازشهاي سيستمهاي اطلاعاتي اجرايي (EIS) معمولا در‌اين سطوح فردی اجرا مي‌شوند.
 يکپارچه سازی داده در محيط معماری
جنبه مهم محيط معماری که در شكل بالا نشان داده نشده، عمليات يکپارچه سازی داده است که در معماري رخ مي‌دهد. همانطور که داده از محيط عملياتي به محيط انبارداده ارسال مي‌شود که در شکل زیر نشان داده شده عمليات يکپارچه سازی روی آن انجام مي‌گيرد.
نکته مهم در انتقال داده از محيط عملياتي به محيط انبار داده بدون عليات يکپارچه سازی است. اگر داده به انبار داده به صورت غير متمرکز وارد شود، نمي‌‌تواند براي پشتيباني ديد صحيحی از داده درسازمان مورد استفاده قرار گيرد، و ديد داده سازمان يكي از ماهيتهای محيط معماری است.در هر محيط داده عملياتي غير مجتمع پيچيده و سخت است. اما به سادگي يك اثر زندگي است. 
و‌اين عمل با عمليات پردازش يکپارچه سازی هرگز خوشايند نبوده است. به منظور کسب مزاياي واقعي يك انبار داده، به هرحال لازم است كه‌اين زحمت، پيچيدگی و صرف زمان را متحمل شويم. نرم افزارهای ETL (استخراج / انتقال/ بارگذاري) مي‌توانند بيشتر‌اين پردازشهای کسل کننده رابه صورت خودكار انجام دهد. بعلاوه پردازش يکپارچه سازی بايد فقط يكبار انجام شود. 
انباره داده

 سيستمهاي عملياتي در مقابل سيستمهاي پشتيبان تصميم
دليل اصلي شكست تلاشهاي گذشته دپارتمان IT براي‌ايجاد اطلاعات استراتژيك چه بود؟دپارتمانهای IT چه کاری انجام داده اند؟دليل اساسي ناتواني درايجاد اطلاعات استراتژيك آن است كه ما تمام مدت، براي‌ايجاد اطلاعات استراتژيك از سيستمهاي عملياتي استفاده کرده‌ايم .‌اين سيستمهاي عملياتي بر مبناي پردازش، كنترل فهرست، پردازش مطالبات، پرداخت سرپايی وغيره طراحي نشده بوده يا به هدف‌ايجاد اطلاعات استراتژيك‌ايجاد نشده بودند.اگر بايد قابليت‌ايجاد اطلاعات استراتژيك وجود داشته باشد، بايد اطلاعات را از انواع مختلف سيستمها اخذ کنيم . فقط سيستمهاي پشتيبان تصميم که به صورت خاص طراحي شده انديا سيستمهاي اطلاعاتي مي‌توانند اطلاعات استراتژيك‌ايجاد كنند.اجازه دهيدببينيم به چه دليل؟
ايجاد چرخه‌هاي تجاری 
سيستمهاي عملياتي سيستمهاي پردازش تراكش online (‌OLTP ) هستند .‌اينها سيستمهايي هستند كه براي اجراي روزانه عمليات تجاري سازمان به كار مي‌روند . سيستمهاي عملياتي چرخه‌هاي تجاری را‌ايجاد مي‌کنند(به شکل 1- 5 توجه کنيد) .آنها پردازشها ي تجاري ابتدايی شركت را انجام مي‌دهند.‌اين سيسمتها معمولاٌ داده را از بانك اطلاعاتي دريافت مي‌کنند.هر تراكنش اطلاعاتي در باره يك ورودي بر مبناي يك در خواست، يك صورتحساب، يا يك مشتري پردازش مي‌شود . 

 

0 نظر

نظر محترم شما در مورد مقاله های وب سایت برنامه نویسی و پایگاه داده

نظرات محترم شما در خدمات رسانی بهتر ما را یاری می نمایند. لطفا اگر مایل بودید یک نظر ما را مهمان فرمائید. آدرس ایمیل و وب سایت شما نمایش داده نخواهد شد.

حرف 500 حداکثر