بررسی انباره داده بخش چهارم
توصيف محيط معماری
سطوح طبيعي تفکيک داده دليل اصلی تفاوت بين داده ابتدايي و مشتق شده را در شكل زیر نشان ميدهد.
چهار سطح داده در محيط معماري وجود دارد كه عبارتند از: سطح عملياتي، سطح اتوميك يا انبار داده، دپارتمان (يا سطح Data Mart) و سطح فردی.اين سطوح مختلف داده مبناي يك معماري بزرگ هستند كه کارخانه اطلاعات سازمان گفته ميشوند. سطح عملياتي داده فقط داده ابتدايي بر مبناي نرم افزار را نگهداري ميكند و اصولا مجموعه پردازش تراكنش با كارايي بالا را سرويس ميدهد. سطح انبار داده، داده مجتمع شده را نگهداري ميكند، داده ابتدايي تاريخ داری كه نميتواند به روز رساني شود. به علاوه بعضي دادههاي مشتق شده هم در آن پيدا ميشود. سطح دپارتمان يا Data Mart داده، که از طريق نيازمنديهاي كاربرنهاي در يك قالب كار آمد خاص برای نيازهاي دپارتمان شکل ميگيرد. و در آخر سطح فردی داده جايي است كه بيشتر تحليلهای کشف کننده در آن انجام ميگيرد.
سطوح مختلف داده از مجموعه بالاتری از موجوديتهای معماري تشکيل ميشود.اين موجوديتها کارخانه اطلاعات سازمان را تشکيل ميدهد. بعضي مردم عقيده دارند محيط معماری داده افزونه زيادي توليد ميكند. به هر جهت در نگاه اول بديهی نيست، امااين تمام موضوع نيست. در عوض محيط وب است كه مقاديرانبوهی از داده افزونهايجاد ميكند.
در سطح عملياتي يك ركورد براي مشتري به نام J,Jonesوجود دارد. ركورد سطح عملياتي حاوی مقدار جاري داده است كه ميتواند در يك لحظه به روز رساني شود و موقعيت جاري مشتري را نشان دهد. البته اگر اطلاعات Jones عوض شود ركورد سطح عملياتي تغيير داده خواهد شد تا روی داده جاری تاثير بگذارد.
محيط انبار داده حاوی رکوردهای زيادی مربوط به Jones است كه تاريخ اطلاعات مربوط به وی رانشان ميدهد. براي نمونه انبار داده براي استخراج محل زندگی Jones در سال گذشته جستجو ميشود. بين ركوردهاي محيط عملياتي كه اطلاعات جاري را نگهداري ميكند و محيط انبار داده كه داده اطلاعات تاريخ دار را نگهداري ميکند، هيچگونه تکراری وجود ندارد. اگر يك تغيير آدرس براي Jones وجود داشته باشد پس يك ركورد جديد در انبار دادهايجاد ميشود يعني از تا تاريخ خاص Jones در آدرس قبلي زندگي ميكرده است.توجه كنيد كه ركوردها در انبارداده برخوردی از نظر تکراری شدن ندارند. همچنين توجه كنيد كه بعضي عناصر زماني در يك ركورد انبارداده ميتواند وجود دارد.
محيط دپارتمان (گاهي سطح Data Mart ، سطح OLAP يا سطح DBMS چند بعدي گفته ميشود) حاوي اطلاعات مورد استفاده دپارتمانهای بخشهای مختلف يك سازمان است. يك بانك اطلاعاتي دپارتمان فروشگاه، يك بانك اطلاعات دپارتمان حسابداري، يك بانك اطلاعاتي دپارتمان آمار و غيره ميتواند از اين نوع باشد.
انبارداده منبع کليه دادههای دپارتماني است. در حاليكه داده در Data Mart مطمئنا با داده در سطح عملياتي يا انبارداده ارتباط دارد، داده درون يک محيط دپارتماني يا Data Mart اصولا از داده در محيط Data Mart ديگر متفاوت است. چرا كه داده Data Mart با توجه به نيازهاي عملياتي يك دپارتمان خاص غير نرمال، خلاصه شده و با ساختار خاص ارائه ميگردد.
داده نمونه در سطح دپارتماني/ Data Mart يك فايل ماهانه مشتري است. در فايل يك ليست از مشتريان با دسته بندي وجود دارد. Jones هر ماه به همراه ساير مشتريان دراين گروهها قرار داده ميشود.اين مورديک بسط داده براي توصيف تطبيق اطلاعات است که افزونه شده اند.
سطح آخر داده سطح فردی است. داده فردی معمولا داده كوچك و موقتی است. بيشتر تحليلهای کاشف اطلاعات در سطح فردی انجام ميشود، بر طبق قاعده، سطوح فردی داده به وسيله Pc پشتيباني ميشوند .پردازشهاي سيستمهاي اطلاعاتي اجرايي (EIS) معمولا دراين سطوح فردی اجرا ميشوند.
يکپارچه سازی داده در محيط معماری
جنبه مهم محيط معماری که در شكل بالا نشان داده نشده، عمليات يکپارچه سازی داده است که در معماري رخ ميدهد. همانطور که داده از محيط عملياتي به محيط انبارداده ارسال ميشود که در شکل زیر نشان داده شده عمليات يکپارچه سازی روی آن انجام ميگيرد.
نکته مهم در انتقال داده از محيط عملياتي به محيط انبار داده بدون عليات يکپارچه سازی است. اگر داده به انبار داده به صورت غير متمرکز وارد شود، نميتواند براي پشتيباني ديد صحيحی از داده درسازمان مورد استفاده قرار گيرد، و ديد داده سازمان يكي از ماهيتهای محيط معماری است.در هر محيط داده عملياتي غير مجتمع پيچيده و سخت است. اما به سادگي يك اثر زندگي است.
واين عمل با عمليات پردازش يکپارچه سازی هرگز خوشايند نبوده است. به منظور کسب مزاياي واقعي يك انبار داده، به هرحال لازم است كهاين زحمت، پيچيدگی و صرف زمان را متحمل شويم. نرم افزارهای ETL (استخراج / انتقال/ بارگذاري) ميتوانند بيشتراين پردازشهای کسل کننده رابه صورت خودكار انجام دهد. بعلاوه پردازش يکپارچه سازی بايد فقط يكبار انجام شود.
سيستمهاي عملياتي در مقابل سيستمهاي پشتيبان تصميم
دليل اصلي شكست تلاشهاي گذشته دپارتمان IT برايايجاد اطلاعات استراتژيك چه بود؟دپارتمانهای IT چه کاری انجام داده اند؟دليل اساسي ناتواني درايجاد اطلاعات استراتژيك آن است كه ما تمام مدت، برايايجاد اطلاعات استراتژيك از سيستمهاي عملياتي استفاده کردهايم .اين سيستمهاي عملياتي بر مبناي پردازش، كنترل فهرست، پردازش مطالبات، پرداخت سرپايی وغيره طراحي نشده بوده يا به هدفايجاد اطلاعات استراتژيكايجاد نشده بودند.اگر بايد قابليتايجاد اطلاعات استراتژيك وجود داشته باشد، بايد اطلاعات را از انواع مختلف سيستمها اخذ کنيم . فقط سيستمهاي پشتيبان تصميم که به صورت خاص طراحي شده انديا سيستمهاي اطلاعاتي ميتوانند اطلاعات استراتژيكايجاد كنند.اجازه دهيدببينيم به چه دليل؟
ايجاد چرخههاي تجاری
سيستمهاي عملياتي سيستمهاي پردازش تراكش online (OLTP ) هستند .اينها سيستمهايي هستند كه براي اجراي روزانه عمليات تجاري سازمان به كار ميروند . سيستمهاي عملياتي چرخههاي تجاری راايجاد ميکنند(به شکل 1- 5 توجه کنيد) .آنها پردازشها ي تجاري ابتدايی شركت را انجام ميدهند.اين سيسمتها معمولاٌ داده را از بانك اطلاعاتي دريافت ميکنند.هر تراكنش اطلاعاتي در باره يك ورودي بر مبناي يك در خواست، يك صورتحساب، يا يك مشتري پردازش ميشود .