بررسی data warehouse

بررسی انباره داده بخش دوم

 وقتي مديريت، گزارشات مبهمی دريافت مي‌كند،‌اين امر وی را مجبور به اتخاذ تصميمات بر مبنای سياستها و خصوصيات شخصی مي‌کند .چرا که منابع اطلاعاتی دارای درجه اعتبار کمتری است.‌اين مثالي از بحران اعتبار داده در سيستمهای توسعه يافته امروزی است.

اين بحران شايع و قابل پيش بيني است چرا؟ همانطور كه در شكل  نمايش داده مي‌شود، به پنج دليل زير:
وجود داده فاقد مبناي زماني 
 وجود داده دارای ضريب تغيير الگوريتمی
 سطوح استخراج مختلف 
 وجود مشكل داده خارجي
 وجود منبع داده غير مشترك از ابتدا
انباره داده
دليل اول بحران قابل پيش بيني آن است كه داده فاقد مبناي زماني است. این  شكل  يك اختلاف زمان را نشان مي‌دهد. يك دپارتمان داده‌اش را براي آناليز در يك بعد از ظهر يكشنبه استخراج  مي‌كند و دپارتمان ديگر در صبح چهارشنبه .آيا دليلی وجود دارد که بگوييم آناليز انجام شده در يك نمونه داده در يك روز همان خواهد شد كه آناليز براي همان داده در روز ديگر؟ البته كه نه. داده درسازمان هميشه در حال تغيير است. بين مجموعه‌های داده آناليز شده كه در زمانهای متفاوت به دست آمده، هر اتفاقی ممکن است واقع شده باشد.
انباره داده

دليل دوم ضريب تغيير الگوريتمی داده است. براي مثال يك دپارتمان براي آناليز حسابهاي قبلي انتخاب مي‌شود. دپارتمان ديگر براي آناليز كليه حسابهاي بزرگ انتخاب مي‌شود.‌ايالازم است ارتباطي بين خصوصيات مشتريهايی وجود داشته باشدكه حسابهاي قديمی دارد و مشتريهايی كه حسابهاي بزرگ دارند؟ مطمئناٌ خير. پس چرا بايد نتيجه خيلي متفاوت هر شخصي را غافلگير كند؟
دليل سوم از دليل اول بسيار بزرگتر است .هر زمان يك استخراج جديد انجام مي‌شود احتمال بروز اختلافات زياد بدليل زمان يا ضريب تغييرالگوريتمی بيشتر مي‌شود. و براي سازمانی كه هشت تا نه سطح استخراج از زمان ورود داده به سازمان تا زمان آناليز آن براي مديريت انجام ‌شده است، امر غير طبيعيي نيست. آنها استخراجها، استخراجهاي استخراجها، استخراجهاي استخراجهاي استخراجها و به همين ترتيب هستند.هر سطح جديد استخراج مشكلاتی که درسطح قبل رخ ‌داده را اغراق آميز مي‌كند.
دليل چهارم براي فقدان اعتبار داده مشكل ارسال داده خارجي است. با وجود تكنولوژيهاي امروز در سطح کامپيوتر‌های شخصی، انتقال داده از منابع خارجي آسان است. براي مثال در شكل نشان مي‌دهد که يك تحليلگر داده را برای جريان اصلی آناليز از WallStreetjournal انتقال مي‌دهد و تحليلگر ديگری آوردن داده از Business Work بر عهده دار مي‌گيرد. هر چند وقتي داده‌ای منتقل مي‌شود، هويت داده خارجي بودن خود را از دست مي‌دهد. به خاطر‌اينكه مبدا داده رديابی نمي‌‌شود، مي‌تواند داده‌ای توليد شود که ممکن است از هر منبعي منتقل شده باشد. 
از‌اين گذشته تحليلگری كه داده را از WallStreet منتقل مي‌کند، چيزي درباره داده كه از BusinessWork منتقل مي‌شود، نمي‌‌داند و برعكس. تعجبي ندارد که داده خارجي در عدم اعتبار داده در سيستمهای توسعه يافته امروزی نقش مهمی را ‌ايفا مي‌کند.
آخرين عامل مؤثر در عدم اعتبار آن است كه اغلب يک منبع داده‌اي مشترك از ابتدای کار وجود ندارد. تحليلگر دپارتمان A از فايل XVZ داده را دريافت مي‌کند، تحليلگر دپارتمان B از بانك ABC داده را دريافت مي‌کند. در نتيجه بهيچوجه هيچ اشتراك زماني و داده‌اي بين فايل XZY و بانك ABC وجود ندارد.
 مشكلات در بهره وری
فقط اعتبار داده مشكل اصلي سيستمهای توسعه يافته امروزی نيست. بهره وری نيز بسيار اهميت دارد. به ويژه وقتي كه نياز به تحليل داده در سازمان مطرح شود.
انباره داده
 سازمانی را در نظر بگيريد كه تجارتي انجام مي‌دهد و حجم زيادی از داده را توليد مي‌کند، همانطور که در شكل نشان داده شده است.
مديريت درصدد توليد گزارشات سازمانی، بااستفاده از فايلها و مجموعه‌های داده جمع آوری شده در طی سالها مي‌باشد.طراح سه عملی را که بايد برای توليد گزارشات سازمان انجام شود، در نظر مي‌گيرد:
قرار دادن و تحليل داده براي گزارش
گردآوری داده براي تهيه گزارش

 

0 نظر

نظر محترم شما در مورد مقاله های وب سایت برنامه نویسی و پایگاه داده

نظرات محترم شما در خدمات رسانی بهتر ما را یاری می نمایند. لطفا اگر مایل بودید یک نظر ما را مهمان فرمائید. آدرس ایمیل و وب سایت شما نمایش داده نخواهد شد.

حرف 500 حداکثر