بررسی data warehouse

بررسی انباره داده بخش ششم

 همينطور برای يک مؤسسه بانكی، مجموعه داده برای يك عمليات وام متقاضيان شامل اطلاعاتی برای همان كاربرد خاص است. مجموعه داده برای ساير کاربردهای محدود مثل بررسی حسابها وثبت موجودی حسابها با همان عملِيات ويژه ارتباط دارد. در مورد يك شركت بيمه نيز، هر مجموعه داده‌ مختلف، عملياتهای مربوط به خود را پشتيبانی می کنند مثل بيمه اتومبيل، بيمه عمر و بيمه تامين اجتماعی.

بنابراين، مجموعه داده برای هر عمليات نيازمند سازماندهی بر مبنای يک كاربرد مشخص برای همان عمليات دارد.
در مقايسه با سيستمهای عملياتی که توضيح داده شد، درانبار داده،  اطلاعات بر مبنای موضوع ،نه براساس يک كاربرد خاص ذخيره می‌شوند.اگر داده براساس موضوعات کاربردی ذخيره شده باشد، موضوعات کاربردی چه می توانند باشند؟ موضوعات کاربردی از چندين جنبه می تواند  متفاوت به نظر برسد. اين موضوعات برای کاربردهای مختلفی نقاط بحرانی هستند. برای يک  شركت‌ توليدی، موضوعات کاربردی بحرانی، فروش ،بازاريابی و فهرست اموال است. برای يك فروشگاه خرده فروشی، نرخ فروشها  مساله بحرانی است.
انباره داده


شكل بالا وجه تمايز نحوه ذخيره سازی داده در سيستم‌های عملياتی و  انبار داده را نشان می دهد. در سيستمهای عملياتی، داده برای هر كاربرد ويژه به طورمختلفی سازماندهی می‌شود: پردازش دستور،وامهای مشتری،صدور صورتحساب مراجعين ، وصول حسابها ،پردازش مطالبات و ذخيره سازی حسابها. برای مثال مطالبات ،يك موضوع کاربردی بحرانی برای يك شركت بيمه می تواند تلقی شود. مطالبات تحت سياستهای بيمه خودرو در عمليات بيمه اتومبيل پردازش می‌شوند که اطلاعات اين مطالبات در همان عمليات سازماندهی می گردد . به طور مشابه اطلاعات مطالبات بيمه کارگری در عمليات بيمه کارگری صورت می گيرد. اما در انبار داده يک شركت بيمه اطلاعات مطالبات تحت موضع "مطالبات" و نه بر اساس عمليات مجزای بيمه خودرو وبيمه کارگری سازماندهی می‌شود.
در يك انبار داده اثری از عمليات يا پردازش خاص وجود ندارد. اطلاعات در انبار داده مستقل از عملياتها است.
 
 داده يكپارچه 
به منظور اتخاذ تصميم مناسب، نياز به استفاده از کليه اطلاعات زمان دار نرم افزارهای مختلف داريم. داده‌ها درانبار داده ممکن است از چندين سيستم عملياتی به مخزن داده منتقل شوند. منبع داده می تواند بانکهای اطلاعاتی مختلف، فايلهاوSegment های داده باشند. پس محيطهای عملياتی و سيستمهای عملياتی می تواند از نظر ساختار باهم فرق داشته باشند. قالب بندی فايلها، کدبندی حروف وقرارداد نامگذاری فيلدها همه می تواند به صورتهای متفاوتی  باشند.
بعلاوه داده سيستمهای عملياتی داخلی ، همانند داده منابع خارجی دارای اهميت زيادی است. انبار داده  ممکن است نيازمند داده چنين منابعی باشد.
 شكل2-2 يك پردازش ساده يكپارچه سازی اطلاعات يك مؤسسه بانكی را نمايش می دهد. در اينجا داده به درون ناحيه موضوعی Account  انبار داده از سه منبع کاربردی متفاوت جمع آوری می شود. هركدام از سه منبع می توانند از چندين جنبه با هم تفاوت داشته باشد.
انباره داده
 

قراردادهای نامگذاری ؛صفات برای قلم دادها می‌توانند موارد اختلاف منابع با هم باشند. ممکن است شماره حساب درعمليات ثبت حساب 8 بايت طول، اما در عمليات بررسی حساب  فقط 6 بايت طول داشته باشد.
قبل از اينكه داده بتواند به صورت کارآمد از منابع ناهمگون مختلف به درون انبار داده  ذخيره شود، بايد ناسازگاريهای داده ای آن برطرف شوند، اجزاء داده ای استاندارد شده و از مفاهيم نامهای اشياء در هر منبع مطمئن شد. همچنين می بايست قبل از اينكه داده به داخل انبار داده منتقل شود ، يك پردازش کامل جهت تغيير شکل ،تثبيت و يكپارچه سازی داده‌های منبع صورت گيرد.
دراينجا چند قلم كه نياز به استانداردسازی دارد را ذكر می‌كنيم.
قراردادهای نامگذاری
 كدها
 صفات داده
 مقياسهای اندازه گيری
 
 داده زمان دار
در يك سيستم عملياتی، داده ذخيره شده حاوی مقادير جاری است .در يك سيستم وصول حساب، باقيمانده حساب همان باقيمانده حساب قابل توجه جاری در حساب مشتری است. در يك سيستم ورود دستور، وضعيت يك دستور وضعيت جاری آن دستور است. در يك عمليات وام مشتری، مبلغ باقيمانده حساب مشتری  بدهکار، مبلغ جاری است. البته چند تراکنش آخر در سيستمهای عملياتی نگهداری می شوند، اما، ضرورتا آنها اطلاعات جاری را منعکس نمی کنند چراکه اين سيستمها عمليات جاری روزانه را پشتيبانی می کنند.
از طرف ديگر داده انبار داده به منظور تحليل و اتخاذ تصميمات مديريتی سازماندهی شده است. اگر يك كاربر در الگوی خريد يك مشتری خاص جستجو كند نه تنهانيازمند اطلاعات خريد جاری است بلکه احتياج به اطلاعات خريدهای قبلی وی نيز دارد. زمانيکه کاربری به دنبال دليلی برای ازقلم افتادگی فروشها در بخش شمال غربی می باشد، به کليه اطلاعات فروش برای آن بخش در يك بازه زمانی خاص درگذشته نياز دارد.
در صورتيکه يك تحليلگر در يك فروشگاه زنجيره ای بخواهد دو يا چند محصول را با هم مورد بررسی قراردهد، به نرخ فروشهای آن محصول خاص دربعضی فصول گذشته نياز دارد.
انبار داده به منظور طبيعی ‌ترجلوه دادن مقصود خود نه فقط بايد حاوی مقاديرجاری داده بلکه دارای داده‌های قبلی نيز باشد. اطلاعات به عنوان SnapShot هايی  از گذشته و دوره‌های جاری ذخيره می شود. هر ساختار داده درانبار داده دارای زمان می باشد. اين جنبه از انبار داده هم برای فاز طراحی و هم فاز پياده سازی کاملا معنی دار است.
برای مثال در يك انبارداده حاوی واحدهای فروش، تعداد رکوردهای هر فايل ياسطرهای جدول وابسته به يك زمان خاص ذخيره می‌شود. بسته به سطح جزئيات در انبار داده ، تعداد فروش در يك ركورد می‌تواند وابسته به روز، هفته، ماه و يافصل باشد.
ويژگي زمانداری داده در يك انبار داده  به منظور: 
امکان تحليل درگذشته 
- وابستگی اطلاعات به حال حاضر 
- توانايی پيش بينی برای آينده است.
 داده غير فرار 
داده از سيستمهای عملياتی مختلف استخراج  شده واطلاعات مربوطه از منابع خارجی به دست آمده و درانبار داده تغيير شکل يافته، يكپارچه شده و ذخيره می‌شود . سيستم انبار داده به منظور اجرای كارهای روزانه نمی باشد. وقتی  دستوری از طرف مشتری صادر می شود، کل انبار داده برای يافتن وضعيت جاری انبار جستجو نمی شود. دستور ورودی عمليات برای آن عمليات معنی دارد. در انبار داده، اطلاعات وضعيت انباراستخراج شده به عنوان SnapShot برمبنای زمان نگهداری می شود .هر زمان که دستوری صادر می شود، انبار داده به روز نمی شود. داده از سيستمهای عملياتی در فواصل خاص به انبار داده  منتقل می‌شود. وابسته به نيازهای کاری اين انتقالهای داده می تواند هر دو روز يكبار، هر روز، هر هفته و يا دو هفته‌ يكبار صورت گيرد. در حقيقت در يك نمونه انبار داده ، انتقالهای داده از مجموعه‌های مختلف داده می‌تواند در فركانسهای زمانی متفاوت انجام شود. تغييرات لازم روی صفات محصولات می‌تواند هفته ای صورت گيرد. هر تجديد نظردر راه‌اندازی جغرافيايی می‌تواند ماهيانه انتقال يابد. تغييرات واحدهای فروش می‌توانند به صورت روزانه منتقل شوند. انتقالهای داده ای يا بارگذاری داده برمبنای نيازمنديهای كاربران توسط مدير سيستم برنامه‌ريزی و زمان بندی می شود.
همانطور كه در شكل2-3 نشان داده شده، هر تراكنش ، داده انبار داده رابه روز نمی‌رساند. تراکنشهای  بانکهای اطلاعاتی ،سيستم عملياتی را به صورت لحظه‌ای بروزرسانی می کنند. پس داده درسيستم عملياتی براثر رخدادهای تراکنشی اضافه شده، تغييرداده شده يا حذف می گردد، اما معمولا عمل بروز رسانی در انبار داده از اين طريق انجام نمی شود. داده در انبارداده به صورت لحظه ای حذف نمی شود، و تراکنشهای خاصی به منظور تغيير داده در انبار اجرا نمی شوند. در بانکهای عملياتی ؛ و نه در يک انبار داده بروزرسانيهای داده ای امری عادی است. داده در انبار داده همانندداده در بانکهای عملياتی فرار نيست. داده در انبار داده اصولا به جهت آناليز و پاسخگويی به درخواست وجود دارد.
 
مرورلايه های مختلف انبارداده 
وقتي يك سيستم عملياتی مثل ورود درخواست، پردازش وامها يا ثبت حساب را ايجادمی کنيم، چندين لايه انتزاعی را برای ايجاد سيستم در کنار هم قرارمی دهيم که لايه انتزاعی نهايی GUI (واسطه گرافيكی كاربر) برای ارتباط با كاربران جهت ورود داده می باشد. لايه data stroge شامل سيستم مديريت بانک، مثل Oracle، Informix ياMicrosoft SQL Server  است. لايه نمايش شامل مجموعه‌ای از صفحات وگزارشات برای كاربران است.

 

0 نظر

نظر محترم شما در مورد مقاله های وب سایت برنامه نویسی و پایگاه داده

نظرات محترم شما در خدمات رسانی بهتر ما را یاری می نمایند. لطفا اگر مایل بودید یک نظر ما را مهمان فرمائید. آدرس ایمیل و وب سایت شما نمایش داده نخواهد شد.

حرف 500 حداکثر