بررسی data warehouse

بررسی انباره داده بخش سیزدهم

 معماری data mart مستقل

معماری data mart مستقل به صورتdata mart های مجزا می باشند كه به وسيله گروههای كاری، دپارتمانها با خطوط تجاری خاص كنترل می شود و به صورت مجزا به منظور برطرف كردن نيازهای خاص ساخته می‌شود. در حقيقت هيچگونه اتصالی با data mart  های ساير گروهها، دپارتمانها يا خطوط تجاری نمی‌تواند وجود داشته باشد. برای مثال، داده برای اين data mart ها می‌تواند به صورت داخلی توليد شود. داده می‌تواند از سيستمهای عملياتی استخراج شود اما نياز به حمايت اين عمليات از طريق سيستم اطلاعاتی می باشد.سيستم  اطلاعاتی ،نحوه پياده‌سازی را كنترل نمی‌كند اما به راحتی  به مديريت محيط كمك می‌كند. همچنين داده می‌تواند از منابع خارجی استخراج شود. در اين صورت سيستمهای اطلاعاتی نيز می ‌توانند علاوه بر مهارتهای مناسب موجود در گروههای كاری، بادپارتمانها يا خطوط تجاری ديگردرگير شوند.
معماری data martهای  مستقل نياز به برخی مهارتهای تکنيکی پياده سازی دارد ولی در هر حال 
انباره داده
 
خود منابع و پرسنل می توانند مالک هر data mart  بوده و توسط گروه کاری ،دپارتمان ، يا خطوط تجاری خود  مديريت شوند. اين نوع پياده‌سازی عموما كمترين فشارروی منابع سيستمهای اطلاعاتی را دارد و می تواند به يک پياده‌سازی سريع‌تر منجر شود. به هرحال در اين معماری ، حداقل مورد يكپارچگی و عدم ديدگاه کلی ترنسبت به اطلاعات می تواند جزو محدوديتها باشد. اين بدان معنی است كه داده در هر data mart خاص می تواند فقط توسط همان گروه كاری، دپارتمان يا خطوط تجاری که مالك data mart است، قابل دسترسی باشد.
 
معماری data mart  های متصل
اساسا معماری data mart های متصل يك پياده‌سازی توزيع شده است.هرچند data mart ها جداگانه در يک گروه كاری، دپارتمان يا خط تجاری خاص پياده‌سازی می‌شوند،می‌توانند به صورت يكپارچه يابه هم متصل نيز باشند تا ديدگاه پيشرفته يا وسيع تری از اطلاعات را ايجاد كنند. درحقيقت در بالاترين سطح يكپارچگی، می‌توان آنها رابه صورت يک انبارداه سراسری ديد. بنابراين كاربران نهايی در يك دپارتمان می‌تواند به هر داده دسترسی و از آن در يك data mart از دپارتمان ديگر استفاده كند.
اين معماری، عملکردها و قابليتهای ديگری  را به همراه دارد كه می‌تواند در نظر گرفته شوند. اما به هر حال اين امکانات اضافی می‌تواند محدوديتهای اضافی را ازنظر يكپارچگی و پيچيدگی در مقايسه با معماری data mart مستقل در پی داشته باشد. اکنون  به توصيف اين مورد می پردازيم كه بدانيم چه كسی بايد محيط را كنترل و مديريت ‌كندودر حقيقت لايه ديگر معماری كه برای مثال حاوی داده مشترک در چندين data mart است چه ويژگيهايی دارد.برای پاسخ به اين پرسشها شايد نيازباشد که درباره شمای اشتراك داده در data mart ها بيشتر بدانيم. اگرچه اين امکانات منجر به افزايش درجه پيچيدگی معماری می شود.اما ازيک ديدگاه مثبت نيز ، می‌تواند دارای مزيت باشد. Data mart های متصل‌ می‌توانند مستقلا توسط يك گروه كاری، دپارتمان يا خط كاری كنترل شوند. آنها تصميم می گيرند کدام داده به داخل data mart  بارگذاری شود، چه زمانی داده به روز رسانی شود،چه کسی به آن دسترسی داشته باشد، و داده در کجا قرار گيرد. همچنين آنها درباره ايجاد ابزارها و نوع مهارتهای لازم جهت پياده سازی data mart خودشان تصميم می گيرند. در اين مورد حداقل منابع از سيستمهای اطلاعاتی مورد نياز می باشند. سيستمهای اطلاعاتی مثلا می‌توانند درامنيت درون دپارتمان،ساخت نسخه پشتيبان و انجام اعمال ترميم داده ،و پياده سازی اتصالات شبکه ای  کمک کنند. متقابلا data mart های متصل می توانند توسط سيستم اطلاعاتی کنترل و مديريت شوند.هر گروه كاری، دپارتمان يا خط تجاری خود می تواند مالکيتdata mart خود را داشته باشد، اما ابزارها و مهارت‌ها و منابع مورد نياز برای پياده‌سازی data mart می‌تواند به وسيله سيستم اطلاعاتی تهيه گردد.
 
از نيازمنديها تا طراحی داده
تعريف كامل نيازمنديها ، ما را به سمت طراحی داده برای انبارداده سوق می دهد. طراحی داده به معنی کنارهم قراردادن ساختارهای داده می باشد. يك گروه از اجزاء داده ،ساختار داده را تشکيل می دهند. طراحی منطقی داده ، شامل تعيين اجزاء مختلف داده ونيز ايجاد تركيبی ازاجزاء داده درون ساختارهای داده ای است که موردنياز هستند. همچنين طراحی منطقی داده شامل ايجاد ارتباطات بين ساختارهای داده می باشد.
به شكل زير نگاه كنيد. توجه كنيد كه چگونه فاز طراحی ازجمع آوری نيازها شروع می‌شود. نتايج جمع آوری نيازها با جزئيات کامل در اين فاز در سند تعريف نيازها نگهداری می‌شود. نکته اساسی در اين سند مجموعه دياگرامهای package اطلاعاتی است. به خاطر داريد كه اينها اطلاعات ماتريس شده‌ای هستند كه به صورت ماتريسها، ابعاد تجاری و سلسله مراتبات ابعاد مجزای تجاری نشان داده می‌شوند.
ساختاردياگرامهای package اطلاعاتی بر مبنای طراحی منطقی داده انبارداده می باشد. نتيجه پردازش طراحی داده به طراحی مدل داده‌ای ابعادی منجر می‌شود.
انباره داده

 گزينه های فاز طراحی
قبل از اينكه به بحث در ارتباط با طراحی مدل داده ابعادی بپردازيم ، اجازه دهيد مرور سريعی داشته باشيم روی چند گزينه تصميم گيری در فازطراحی كه بعضی موارد بايد اتخاذ گردد: 
انتخاب نوع پردازش . انتخاب موضوعات از package های اطلاعاتی برای مجموعه ساختارهای منطقی داده ای كه طراحی می شود.
 
انتخاب grain تعيين سطح جزئيات داده در ساختارهای داده 
شناخت وتطبيق ابعاد. انتخاب ابعاد تجاری (مثل محصول، بازار، زمان و غيره..) برای گنجاندن در مجموعه ساختارهای اوليه و اطمينان از اينكه هر جزء داده خاص در هر روند تجاری با سايرين مطابقت دارد. 
انتخاب factها. انتخاب مقياسهايا واحدهای اندازه گيری (مثل واحدهای فروش محصول فروش به دلار، مقدار سود به دلارو غيره) به منظور گنجاندن در مجموعه ساختارهای اوليه. 
انتخاب دوره بانك اطلاعاتی. تعيين نحوه برگشت به زمان گذشته بااستفاده از داده های زمان دار .
 
 اصول مدلسازی ابعادی
مدلسازی ابعادی نام خود را از ابعاد تجاری می‌گيرد  كه برای تلفيق با مفهوم مدلسازی منطقی داده مورد نياز است. مدلسازی ابعادی ،نوعی تكنيك طراحی منطقی برای ساختار ابعادی و معيارهای تجاری است كه در راستای اين ابعاد تحليل می‌شوند. اين تكنيك مدلسازی مبتنی بر درک اهداف است. همچنين اين مدل برای ايجاد كارايی بالا برای پاسخگويی به درخواستها و تحليلها می باشد.
دياگرام اطلاعاتی چند بعدی نرم افزاركه درباره آن بحث شد، برمبنای مدل ابعادی بنا نهاده شده است. بنابراين، مدل ابعادی شامل ساختارهای ويژه مورد نياز داده برای ارائه ابعاد تجاری می‌باشد. اين ساختارهای داده نيز حاوی معيارها يا factها هستند.

 

0 نظر

نظر محترم شما در مورد مقاله های وب سایت برنامه نویسی و پایگاه داده

نظرات محترم شما در خدمات رسانی بهتر ما را یاری می نمایند. لطفا اگر مایل بودید یک نظر ما را مهمان فرمائید. آدرس ایمیل و وب سایت شما نمایش داده نخواهد شد.

حرف 500 حداکثر