مقاله فشرده سازی فایلها و تصاویر و اطلاعات و صدا


مشاهده سایر پروژه های درس آمار>>>>>

مقاله فشرده سازی فایلها و تصاویر و اطلاعات و صدا

HyperLink
قیمت: 50000 ریال - پنج هزار تومان
گروه: پروژه های درس آمار

تعداد صفحه: 186

فهرست مطالب 
چکیده 6
مقدمه 7
فصل اول :  شیوه های فشرده سازی فایل ها 8
شیوه فشرده سازی فایل ها 9
یافتن افزونگی در فایل 10
فشرده سازی اطلاعات 12
جستجو برای الگوها 14
تا چه میزان می توان اطلاعات را فشرده كرد ؟ 17
فصل دوم :  فشرده سازی فایل های تصویری 20
● فشرده سازی بدون زیان 21
● فشرده سازی با زیان 23
● فشرده سازی JPEG 24
● فشرده سازی JPEG های متحرک 25
● فشرده سازی MPEG 25
● MPEG-1 26
● انواع MPEG 26
● پردازش MPEG 27
● فریم های I 29
● نرخ های مختلف Bit 30
● نرخ های بیتی ثابت 31
● پروفایل ها و درجه بندی 31
● پروفایل اصلی در سطح اصلی 32
● کدگذاری و فشرده سازی ویدیوئی 32
فشرده سازی صوت 33
کوانتیزه کردن 33
مدولاسیون داده 34
PCM Differential 34
MPEG  AUDIO 35
MPEG  AUDIO 35
کدگذار و کدگشای MPEG 35
تاریخچه MP3 36
لایه های صوت در MPEG 37
لایه های صوت در MPEG 37
لایه های صوت در MPEG 37
لایه 2 – فشرده سازی 40
لایه 2 – فشرده سازی 40
لایه2- فشرده سازی 41
لایه 3 – تاثیرات psycho- Acoustic 41
لایه 3 – آستانده های موجود در باندهای حیاتی 41
کدگذاری گفتار 42
Linear Predictive Coding 42
Linear Predictive Coding 43
LPC Encoder 43
LPC Encoder 43
فصل سوم :  الگوریتم فشرده سازی فایلهای  MP3 44
mp3 چيست؟ 46
هدف از الگوریتم فشرده سازی فایلهای MP3 48
مراحل الگوریتم MP3 51
فرمت bitstream 52
خلاصه ای از تکنولوژی MP3 52
حداقل آستانه شنوایی 52
اثر masking 52
ذخیره بایت ها 53
کد گذاری هافمن 53
فصل چهارم :  الگوریتم فشرده سازی هافمن 54
فصل پنجم :  نقش فراکتالها در فشرده سازی 60
تعریف آشوب 62
فراکتالها 63
هندسهٔ فرکتالی 69
هندسه فراکتالی چیست؟ 69
● پروفایلها و درجه بندی 79
● پروفایل اصلی در سطح اصلی 79
● کدگذاری و فشرده سازی ویدیوئی 80
فصل ششم :  فشرده سازی فرمتهای ضبط مغناطیسی 83
كارآ ويدئو ديجيتال را وعده ميدهد 84
راه حل های تلویزیون ماهواره ای 86
فرآیند فشرده سازی تصاویر 88
رمز گشایی تصاویر 89
فصل هفتم :  فشرده سازی عکسها و تحریف واقعیت 92
فصل هشتم :  نگاهی دقیقتر به فرمتهای فشرده سازی 99
معرفی بعضی از فرمتهای فشرده سازی تصویری 100
فصل نهم :  آشنائی با Picture Codecs 104
آشنایی با کدک های تصویر Video Codec 105
کدک‌های خانواده Mpeg 105
مفاهیم کلی ماکرو بلوکها و حرکت 107
انواع فرمها 107
کوانتیزر Quantizer 108
روش‌های کد کردن تصاویر One Pass 109
Multipass 109
One Pass Quality Based 109
کد کردن به صورت Bidirectional 110
Adaptive Single Consecutive 111
Adaptive Multiple Consecutive 111
شماره گذاری فرم ها در تصویر کد شده 112
یک چهارم پیکسل (Quarter Pixcel) 112
فشرده سازی حرکت عمومی ((Global motion compensation(GMC) 113
فصل دهم :  فشرده سازی و تاثیر بر فرکانس 114
پهناي باند بحراني گوش 116
اصول فشرده سازي در فرکانسها 117
فرمت هاي فشرده سازي 118
فصل یازدهم :  فشرده سازی و تاثیر بر فرکانس 121
فرمتJPEG 123
فرمتGIF 123
فرمتPNG 124
فصل یازدهم :  فشرده سازی در صفحات  ASP.Net 126
فصل دوازدهم :  پیاده سازی الگوریتم هافمن در VB.NET 138
فصل سیزدهم :  فشرده سازی پیام ها در وب سرویس ها 161
فشرده سازی پیام ها هنگام استفاده WebService ها 162
پیش نیاز ها 162
فصل چهاردهم :  فشرده سازی CSS به کمک PHP 182
منابع و مواخذ 185
کتب و مجلات 185
وب سایتهای اینترنتی 185

فشرده سازی فایلها و تصاوی مساله ای است که مورد توجه تمامی افرادی که به گونه ای با کامپیوتر کار می کنند می باشد. البته مساله قابل توجه و مشترک استفاده از فضا به بهترین نحو بدون افت کیفیت فایلها و یا با افت بسیار پائین می باشد.
در پایان نامه جاری سعی شده تا حدودی به مقوله فشرده سازی فایلها و تصاویر و بررسی الگوریتمهای موجود در آن پرداخته شود. برای این منظور پس از این چکیده به مقدمه ای کوتاه پرداخته شده است.
این مقاله در 14 فصل تدوین گردیده که روش و ترتیب ارائه مطالب به شرح ذیل می باشد:
در فصل اول و دوم به توضیح اجمالی در مورد شیوه های فشرده سازی و انواع فیلهایی که بیشتر با فشرده سازی آنها سرو کار داریم پرداخته شده است.
از فصل سوم تا نهم به بررسی الگوریتمهای موجود در زمینه انواع روشهای فشرده سازی پرداخته شده است
در فصل نهم نیز به بررسی برخی از اصططلاحات موجود پرداخته شده است.
در فصلهای آخر نیز به بررسی روشهایی پرداخته شده که با استفاده از آنها افت کیفیت به حداقل می رسد.




مقدمه
فشرده سازی مطالب در حقیقت از جمله مطالبی است که از بدو ورود کامپیوتر به بازار مورد توجه قرار گرفته است. مبحث فشرده سازی فقط مختص زمان نسخه پشتیبان گیری نمی باشد. بلکه در زمانی که یک فایل در حال ذخیره شدن است نیز با الگوریتمهای خاصی فشرئه می شود. 
به عنوان مثال اگر قرار باشد عکسهای طرح بیتی در صورتی که به همان روش که در Ram باز می شوند ذخیره شوند مقادیر بسیار زیادی از حافظه را اشغال خواهند نمود. 
بنابراین در اینجا الگوریتمهای ذخیره سازی و بازیابی فایلها ارزش و نمود پیدا می نمایند. فشرده سازی خود مبحثی جداگانه در علم کامپیوتر است و دارای روشها و الگوریتمهای بسیار پیچیده ای می باشد. البته مطلب مهم در این زمینه پیچیدگی روشها نیست بلکه بررسی و بدست آوردن روشی است که با خطر از بین رفتن اطلاعات بیشترین فضای آزاد را برای ما بوجود آورد.
روش کلی ذخیره سازی و فشرده سازی فایلها یافتن داده های تکراری در فایل و ذخیره آدرسهای آنها در درختهای منطقی با استفاده از آدرسهای آنها می باشد.
در ادامه به بررسی بیشتر روشهای فشرده سازی انواع فایلها و الگوریتمهای موجود خواهیم پرداخت.

فصل اول :  شیوه های فشرده سازی فایل ها

شیوه فشرده سازی فایل ها
اكثر فایل های موجود بر روی اینترنت با استفاده از نرم افزارهایی نظیر WinZip فشرده و بر روی سرویس دهندگان FTP مستقر هستند تا كاربران بتوانند با سرعت مناسب اقدام به دریافت آنها نمایند. فایل های فشرده ZIP یكی از متداولترین و سهل الوصول ترین نوع فایل های فشرده می باشند. با فشرده نمودن فایل ها امكان ارسال سریعتر آنها بر روی اینترنت خصوصا" در مواردیكه سرعت خط ارتباطی كاربران بالا نباشد ، فراهم می گردد. پس از دریافت فایل های فشرده با استفاده از نرم افزارهای مربوطه نظیر WinZip می بایست آنها را به حالت اولیه تبدیل ( از حالت فشرده خارج گردند ) كرد. 

 
هدف از فشرده نمودن فایل ها كاهش ظرفیت فایل ها بوده و در زمان استفاده از فایل می بایست مجددا" فایل به حالت اولیه برگردانده شود. در فرآیند فوق بیت هایی از فایل با استفاده از الگوریتم هایی خاص ، از فایل حذف و زمینه كاهش ظرفیت فایل فراهم خواهد شد. در زمان استفاده از فایل با استفاده از الگوریتم فشرده سازی عملیات معكوس انجام و فایل به حالت اولیه خود برگردانده خواهد شد. در ادامه به برخی از روش های فشرده سازی اطلاعات اشاره خواهد شد. 

یافتن افزونگی در فایل 
اكثرفایل های كامپیوتری ( با محتویات متفاوت ) دارای افزونگی اطلاعات می باشند. این نوع فایل ها دارای اطلاعات تكراری زیادی می باشند. برنامه های فشرده سازی اطلاعات ، اطلاعات تكراری موجود در فایل ها را بر اساس الگوریتم های مربوطه حذف می نمایند. پس از تشخیص اطلاعات تكراری ، صرفا" اطلاعات تكراری یك بار در فایل تكرار و و در سایر موارد ، از مكانیزمهای خاصی برای عدم تكرار استفاده می گردد. 
جمله زیر از ۱۷ كلمه ، ۶۱ حرف ، ۱۶ فضای خالی ، یك نقطه و یك dash ، تشكیل شده است:
"Ask not what your country can do for you — ask what you can do for your country."
اگر هر یك از حروف ، فضای خالی و حروف خاص ، یك واحد از حافظه را اشغال نمایند ، مجموعا" ۷۹ واحد از حافظه توسط عبارت فوق استفاده خواهد گردید (۷۹ = ۱ + ۱+ ۱۶ + ۶۱). بمنظور كاهش ظرفیت فایل می بایست افزونگی اطلاعات در فایل را بررسی كرد. با مشاهده و بررسی عبارت فوق ، نتایج زیر بدست می آید : 
§ كلمه " ask" ، دو مرتبه تكرار شده است . § كلمه " what" ، دو مرتبه تكرار شده است . 
§ كلمه " your" ، دو مرتبه تكرار شده است . 
§ كلمه "country" ، دو مرتبه تكرار شده است . 
§ كلمه "can" ، دو مرتبه تكرار شده است . 
§ كلمه " do" ، دو مرتبه تكرار شده است . 
§ كلمه " for" ، دو مرتبه تكرار شده است . 
§ كلمه "you" ، دو مرتبه تكرار شده است . 

با عدم لحاظ نمودن حروف بزرگ و كوچك درعبارت فوق ، مشاهده می گردد كه نیمی از اطلاعات موجود در عبارت فوق ، زاید و تكراری می باشند. با دقت در عبارت فوق و نحوه افزونگی اطلاعات مشاهده می گردد كه با دارا بودن نه كلمه ask,not,what,your,country,can ،do ،for و you می توان پالایشی مناسبی از عبارت فوق را انجام و در صورت لزوم و با استفاده از نه كلمه فوق ، مجددا" عبارت اولیه را ایجاد نمود. در این راستا و بمنظور ایجاد عبارت فوق كافی است به كلمات موجود در بخش اول (نصف عبارت) اشاره و جایگاه و تعداد تكرار هر یك از آنها را در بخش دوم مشخص نمود. در ادامه نحوه فشرده سازی اطلاعات و بازسازی مجدد آنها بررسی می گردد. 

فشرده سازی اطلاعات 
اكثر برنامه های فشرده سازی از مدل ها ی متفاوت الگوریتم مبتنی بر دیكشنری ایجاد شده توسط "Lempel و Ziv" ، بمنظور كاهش ظرفیت فایل ها ، استفاده می نمایند. منظور از دیكشنری در الگوریتم فوق ، روش های كاتولوگ نمودن بخش هایی از داده است. 
سیستم استفاده شده برای سازماندهی دیكشنری متفاوت و در ساده ترین حالت می تواند شامل یك لیست عددی باشد. با مراجعه مجدد به عبارت اشاره شده در بخش قبل ، كلمات تكراری را انتخاب و آنها را در لیست مرتب شده ای بصورت زیر ایندكس می نماییم . پس از ایجاد لیست فوق ، می توان در مواردیكه از كلمات در عبارت استفاده می شود ، از اعداد نسبت داده شده و متناظر با آنها استفاده كرد. 
دیكشنری ایجاد شده برای عبارت اشاره شده در بخش قبل بصورت زیر است : 
ask 
what 
your 
country 
can 
do 
for 
you 
با توجه به دیكشنری ایجاد شده ، عبارت مورد نظر بصورت زیر خوانده خواهد شد :
"۱ not ۲ ۳ ۴ ۵ ۶ ۷ ۸ — ۱ ۲ ۸ ۵ ۶ ۷ ۳ ۴"
برای بازسازی مجدد عبارت فوق ، لازم است الگوی معادل آن را با توجه به دیكشنری استخراج و در محل مربوطه قرار داد. برنامه هایی نظیر WinZip از فرآیندهای مشابه برای بازسازی مجدد یك فایل و برگرداندن آن به شكل اولیه استفاده می نمایند. 
در فرآیند فشرده سازی عبارت اشاره شده در بخش قبل به شكل جدید آن ( مطابق جدول بالا ) چه میزان ظرفیت فایل كاهش پیدا كرده است ؟ مطمینا" عبارت فشرده شده ظرفیت كمتری نسبت به عبارت اولیه خواهد داشت . در این زمینه لازم است به این نكته مهم اشاره گردد كه دیكشنری ایجاد شده نیز می بایست به همراه فایل ذخیره گردد. در مثال فوق ، عبارت اولیه برای ذخیره سازی به ۷۹ واحد حافظه نیاز داشت . 
 
عبارت فشرده شده ( بهمراه فضای خالی ) ، ۳۷ واحد و دیكشنری ( كلمات و اعداد ) ، نیز ۳۷ واحد حافظه را اشغال خواهند كرد. بدین ترتیب ظرفیت فایل فشرده به ۷۴ واحد حافظه خواهد رسید . با توجه به اطلاعات فوق مشاهده می گردد كه عملا" در رابطه با فشرده سازی عبارت فوق به موفقیت های بزرگی نایل نشده ایم . در این زمینه لازم است به این نكته اشاره گردد كه در مثال فوق ، صرفا" یك " جمله " فشرده شده است . فرض كنید جمله فوق بخشی از یك سخنرانی یك ساعته باشد ، بدیهی است كه در سخنرانی فوق احتمال تكرار كلمات فوق بسیار زیاد خواهد بود . با ایجاد سیستم دیكشنری ، زمینه استفاده از آن در بخش های بعدی سخنرانی نیز وجود داشته و در ادامه قطعا" میزان فشرده سازی جملات موجود در متن سخنرانی نتایج مطلوبتری را بدنبال خواهد داشت . 

جستجو برای الگوها 
در مثال ارایه شده ، تمام كلمات تكراری انتخاب و در دیكشنری قرار گرفتند. در روش فوق ، ساده ترین مدل برای ایجاد دیكشنری استفاده شده است . برنامه های فشرده سازی از مدل های كاملا" متفاوت دیگر در این زمینه استفاده می نمایند.برنامه های فوق نسبت به كلمات متمایز، از یكدیگر شناخت لازم را نداشته و در این راستا صرفا" بدنبال "الگو" خواهند بود. 
 
این نوع برنامه ها بمنظور كاهش ظرفیت فایل ها ، با دقت الگوها را انتخاب و آنها را در دیكشنری مستقر می نمایند. در صورتیكه از دیدگاه فوق فرآیند فشرده سازی دنبال گردد ، در نهایت با یك دیكشنری كاملا" متفاوت با آن چیزی كه قبلا" ایجاد شده بود ، مواجه خواهیم بود. 
اگر یك برنامه فشرده سازی عبارت معروف اشاره شده در بخش قبل را بمنظور یافتن افزونگی ، پیمایش نماید ، پس از دنبال نمودن بخشی از عبارت (ask not what your) ، الگویی جدید را تشخیص خواهد داد. الگوی فوق حرف "t" بوده كه بدنبال آن یك فضای خالی نیز قرار دارد. ( در كلمات "not" و "what" ) . در صورتیكه برنامه فشرده سازی الگوی فوق را در دیكشنری مستقر نماید ، می بایست یك عدد "۱" را در هر زمان كه با حرف "t" و یك فضای خالی بدنبال آن برخورد می نماید ، در دیكشنری ثبت نماید. با ادامه پیمایش عبارت فوق توسط برنامه فشرده سازی ، مشاهده می گردد كه الگوی تشخیص داده شده ( حرف t و فضای خالی بدنبال آن ) به میزان قابل ملاحظه ای در عبارت تكرار نشده و برای ثبت در دیكشنری واجد شرایط مناسب نخواهد بود ، بدین تزتیب الگوی تشخیص داده شده نادیده گرفته شده و عملیات یافتن الگویی دیگر ، دنبال خواهد گردید. 
در ادامه برنامه فشرده سازی متوجه الگوی "ou" می گردد ، الگوی فوق در كلمات "your" و "country" ، تكرار شده است . در صورتیكه عبارت مورد نظر یك فایل طولانی بود ، ثبت و نوشتن الگوی فوق در دیكشنری می توانست به میزان قابل توجه ای از ظرفیت فایل را كاهش دهد. "ou" ، یكی از تركیبات متداول استفاده شده در زبان انگلیسی است . معیار برنامه فشرده سازی عبارتی است كه در حال پیمایش آن است . در ادامه پیمایش عبارت فوق ، یك الگوی مناسبتر تشخیص داده خواهد شد. الگوهای فوق "your" و "country" بوده كه هر یك بدفعات تكرار شده اند. تكرار هر یك از كلمات فوق در عبارت معادل تركیب كلمات "your country" است . در چنین حالتی برنامه قشرده سازی entry موجود در دیكشنری برای الگوی "ou" را با الگوی "your country" ، جایگزین می نماید. عبارت تركیبی "can do for" ، نیز در عبارت اصلی تكرار شده است . ( یك مرتبه پس از "your" و یك مرتبه پس از "you" ) . بدین ترتیب الگوی "can do for you" نیز تكراری خواهد بود. بنابراین می توان در عوض نوشتن ۱۵ حرف ( بهمراه قضای خالی ) ، از یك عدد استفاده كرد. در صورت استفاده از الگوی "your country" ، برای ۱۳ حرف از یك عدد معادل استفاده می گردد ، بدیهی است كه الگوی فوق نادیده گرفته شده در عوض الگوی "r country" و الگوی جدید "can do fo you" ، در دیكشنری ثبت می گردند. برنامه فشرده سازی فرآیند فوق را دنبال و پس از یافتن یك الگو ، محاسبات مربوطه را انجام و الگوی واجدالشرایط را در دیكشنری ثبت خواهد كرد. مهمترین ویژگی "الگوریتم مبتنی بر دیكشنری " ، قابلیت تغییر الگوها در زمان فرآیند فشرده سازی است . 
با توجه به الگوهایی تشخیص داده شده ، دیكشنری مربوطه بشكل زیر خواهد بود . در دیكشنری زیر الگوهای تشخیص داده شده ثبت و برای فضای خالی از كاراكتر "__" استفاده شده است . 
ask >what 
you 
r__country 
__can__do__for__you 
با توجه به دیكشنری فوق ، عبارت اشاره شده در بخش قبل بصورت زیر فشرده می گردد. 
"۱not__۲۳۴۵__–__۱۲۳۵۴" 
عبارت فوق ۱۸ و دیكشنری ۴۱ ، واحد حافظه را اشغال خواهند كرد. بدین ترتیب فایل حاوی عبارت اولیه فوق از ۷۹ واحد حافظه به ۵۹ واحد حافظه كاهش پیدا كرده است . روش استفاده شده بمنظور فشرده سازی عبارت فوق یكی از امكانات موجود بوده و می توان در این راستا از روش های دیگر نیز استفاده كرد. 

تا چه میزان می توان اطلاعات را فشرده كرد ؟ 
میزان ( نسبت ) كاهش ظرفیت یك فایل ، به عوامل متعددی نظیر : نوع فایل ، اندازه فایل و روش فشرده سازی بستگی دارد. 
 
در اكثر زبانهای طبیعی ، حروف و كلمات الگوهای مناسبی را بصورت جداگانه و یا تركیبی ایجاد می نمایند. بدین ترتیب فشرده سازی فایل های متنی نتایج بسیار مطلوبی را بدنبال خواهد داشت . فایل های متنی اغلب پس از فشرده سازی به میزان پنجاه درصد و یا بیشتر ، كاهش ظرفیت را خواهند داشت .
 اكثر زبانهای برنامه نویسی ( مصنوعی ) نیز بدلیل استفاده از مجموعه ای از دستورات كه بصورت تكراری استفاده می شوند ، دارای افزونگی اطلاعات بوده و پس از فشرده سازی نتایج رضایت بخشی را بدنبال خواهد داشت . فایل هایی كه دارای حجم بالایی از اطلاعات منحصر بفرد بوده ( نظیر فایل های گرافیك و یا فایل های mp۳) ، بدلیل عدم وجود الگوهای تكرار شونده ، بخوبی فشرده نخواهند گردید. 
در صورتیكه فایلی دارای تعداد زیادی الگوی تكرار شونده باشد ، میزان افزونگی اطلاعات موجود در فایل به طرز محسوسی ظرفیت فایل را افزایش خواهد داد. بدین ترتیب در زمان فشرده سازی این نوع از فایل ها با توجه به وجود الگوهای تكرار شونده ، ظرفیت فایل در حد قابل قبولی كاهش پیدا خواهد كرد . 
میزان فشرده سازی اطلاعات، به الگوریتم استفاده شده توسط برنامه فشرده سازی نیز بستگی دارد. بدیهی است استفاده از یك الگوریتم با كارآیی بالا ، نتایج مثبتی را در رابطه با فشرده سازی به ارمغان خواهد آورد.

فصل دوم :  فشرده سازی فایل های تصویری

فشرده سازی (Compression)، پردازشی است که با حذف اطلاعات اضافی، داده ها را به علایم دیجیتالی کاهش می دهد.
فشرده سازی (Compression)، پردازشی است که با حذف اطلاعات اضافی، داده ها را به علایم دیجیتالی کاهش می دهد. 
 
این پردازش بسته به پهنای باند مورد نیاز برای انتقال داده ها و میزان فضای ذخیره سازی، آن را کاهش می دهد. اطلاعات دیجیتالی را می توان در هر نوعی که باشد، فشرده کرد. کاهش پهنای باند مورد نیاز امکان انتقال داده های بیشتری را در یک زمان واحد می دهد. فشرده سازی را می توان به دو گروه تقسیم کرد. با فقدان (با زیان) و بدون فقدان (بدون زیان). در فشرده سازی بدون فقدان، تصویر ذخیره شده بدون از دست دادن کمتیرن داده ای، خود تصویر است، اما در فشرده سازی یا زیان، تصویر ذخیره شده خود تصویر اصلی نیست، بلکه شبیه آن است و اطلاعاتی را از دست داده است. 

● فشرده سازی بدون زیان 
فشرده سازی بدون زیان با استقرار کامل و دوباره همه داده های اصلی که در تصویر اصلی وجود داشت، مشخص می شود. فشرده سازی یک سند، فشرده سازی بدون زیانی است که سند ذخیره شده باید درست همانند سند اولیه باشد، نه شبیه به آن. در دنیای بصری، فشرده سازی بدون زیان خود را در اختیار تصویرهائی که بخش زیادی از آنها یک رگ خاص دارد، مثل آسمان آبی، تصویرهای ساخته شده توسط کامپیوتر و محدوده هائی که تها با یک رنگ خاص پر شده اند و نکات قابل توجهی دربرندارند. مثل کارتون ها، گرافیک ها و انیمیشن سه بعدی هم از انواع فشرده سازی بدون زیان هستند. 
یکی از انواع پر کاربرد و معمول در فشرده سازی بدون زیان ”کدگذاری مبتنی بر طول“ است که در گرافیک ها و تصویرهای ساخته شده با کامپیوتر استفاده می شود. این تصویرها بخش های وسیعی دارند که با رنگشان ثابت بوده و یا الگوهای یکسانی در آنها چندین بار تکرار شده است. در تصویرهای دیجیتالی، هر پیکسل از سه رنگ ترکیبی قرمز، سبز و آبی تشکیل شده و هر یک از این پیکسل ها ارزش خاصی برای هرکدام از رنگ ها دارد. بنابراین سه بایت اطلاعات برای هر یک از رنگ ها وجود دارد که در کنار هم معرف یک پیکسل است. 
”کدگذاری مبتنی بر طول“ برخلاف ارزش های RGB برای هر پیکسل، خطوط اسکن را گروه بندی و طول بندی می کند. به گونه ای که برای پیکسل ها شناخته شده باشد. برای مثال، ممکن است بخشی از یک خط ویدیوئی، ردیفی 25تائی از پیکسل های سیاه داشته باشد. این بخش طولی است که به صورت 0 و 0 و 0 و 25 کدگذاری شده است. این یعنی 25 پیکسل وجود دارند که هر کدام از یک چهارم R، یک چهارم G و یک چهارم B یا سیاه تشکیل شده اند. تصویر اصلی از 75 بابت تشکیل شده که (52 پیکسل سه بایتی) برای حفظ و نگهداری اطلاعات است. زمانی که از ”کدگذاری مبتنی بر طول“ برای فشرده سازی استفاده می کنید، می توانید اطلاعات موردنظر را در چهار بایت ذخیره کنید. 
 

● فشرده سازی با زیان 
تصویرهای ویدیوئی که با دوربین گرفته می شوند، به طور معمول برای تکنیک های فشرده سازی بدون زیان مناسب نیستند، چرا که به ندرت پیش می آید که طول آنها برای ارزشگذاری های پیکسل ها مناسب باشد و بتوان میزان کارآئی تصویر را با بهره گیری از این تکنیک ها بالا برد. فشرده سازی ویدیوهای متحرک به طور معمول زیرمجموعه ای از فشرده سازی با زیان است. به کمک این روش، تصویر ذخیره شده مانند تصویر اصلی خواهد بود. زمانی که تصویر با زیان دوبره تولید می شود و یا از حالت فشرده بیرون می آید. اطلاعاتی که در زمان فشرده سازی وجود داشت، به طور کامل حفظ نخواهد شد. فشرده سازی با زیان برای اینکه بتواند عدم وجود اطلاعات را مخفی کند، اطلاعات موجود در مکان هائی را که چشم انسان به آن کمتر حساس است با سبب انتقاد کمتری از تصویر می شود، حذف می کند. 
چشم انسان به تغییرات درجات روشنائی و نور، بیش از تغییرات رنگ (چه ظاهری و چه از نظر غنی سازی) حساس است. در گسترده رنگ ها، چشم انسان بیشتر به محدوده های زرد، سبز و آبی حساس است. چشم انسان همچنین به اشیاء متحرک حساس تر از اشیاء ساکن است. برای مثال خرگوش زمانی که می خواهد شکار کند ساکن و بدون حرکت می ایستد. چرا که به طور غریزی می داند چشم حیوانات دیگر به آنچه که حرکت می کند، حساس ترند تا آنچه که بی تحرک است. بنابراین اگر ساکن و بی تحرک باشد، امکان دید آنها را کمتر می کند. 
در فشرده سازی با زیان، اطلاعاتی حذف می شوند که چشم انسان به آنها حساس نباشد یا حرکت چندانی نداشته باشند. در نمونه کارآمد فشرده سازی با زیان JPEG و MPEG است که هر یک از آنها را در زیر توضیح می دهیم. 
 

● فشرده سازی JPEG 
فشرده سازی JPEG توسط Joint Photographic Experts Group گسترش یافت که استاندارهائی برای فشرده سازی تصویرهای ساکن مانند عکس و گرافیک دارد. در فشرده سازی JPEG، داده های تصویر به دو بخش روشنائی و اطلاعات رنگدانه ای تقسیم می شوند. 
JPEG از مزیت حساسیت بیشتر چشم انسان به تغییرات روشنائی نسبت به تغییرات رنگ استفاده کرده و نسبت به روشنائی موجود در تصویرها نمونه های بیشتری از اطلاعات کروم و رنگ را برمی گزیند. بدین ترتیب، اطلاعات رنگ بندی تا نصف کاهش می یابد. با کاهش کدگذاری اطلاعات زاید روشنائی موجود در تصویر، اطلاعات کلی نیز کاهش می یابند. سایر ارزش ها و اطلاعات باقی مانده ای که پایدار هستند درست همانند روش های فشرده سازی بدون زیان، کدگذاری می شوند. 

● فشرده سازی JPEG های متحرک 
Motion JPEG یا M-JPEG گرفته شده از JPEG است و در فشرده سازی تصویرهای متحرک کارآئی دارد. این روش نسبت به هر یک از تصویرها ، به عنوان یک تصویر ساکن نگریسته و سپس روی آن کار می کند. از آنجائی که تفاوت های کیفیتی از یک فریم به فریم دیگر کمتر از پنج درصد است ، در فریم های نزدیک به هم تنها تغییرات اساسی به وجود می آید. زمانی که به هرکدام از تصویرها به عنوان یک تصویر واحد و نه تصویر متحرک ادامه دار می نگریم، به یک روش موثر در فشرده سازی تصویرهای متحرک می رسیم. 

● فشرده سازی MPEG 
فشرده سازی MPEG توسط Motion Picture Experts Group، گسترش یافت که استانداردهائی برای فشرده سازی تصویرهای متحرک دارد. تکنیک های MPEG موافتنامه هائی برای فشرده سازی، کدگذاری و کدبرداری اطلاعات ساخته است که در آنها تنها روش های کدگذاری مهم نیستند، بلکه قاعده ها و دستورالعمل ها طرز قرارگیری اطلاعات را نشان می دهند و می گویند که چه چیزهائی باید در داده ها وجود داشته باشند، اما در مورد روشی که اطلاعات توسط آن به دست می آید، هیچ توضیحی نمی دهند. این بدان معنا است که بدون ایجاد تغییرات دائمی در تجهیزات امروزی می توان پیشرفت هائی در زمینه تکنیک های کدگذاری داشت. در فشرده سازی MPEG,M-JPEG از بیشترین برتری ها در زمینه شباهت های بین فریمی برخوردار است و این به عنوان مهمترین و کلیدی ترین تکنیک فشرده سازی محسوب می شود. 

● MPEG-1 
هر خطی در هر زمینه ای از تصویرهای دیجیتالی که باشد، از 704 پیکسل تشکیل شده است. فشرده سازی MPEG-1، به ازاء هر یک فریم از ویدیو، یک زمینه در 352 پیکسل و به ازاء هر یک خط استفاده می کند. استفاده نیمی از وضوح به صورت افقی و خطوط اسکن یکی در میان به صورت عمودی تصویری یا وضوح تصویر یک چهارم را می آفریند. MPEG-1 یکی از ساده ترین روش های فشرده سازی تصویرهای متحرک است و در آن هیچ تجزیه و تحلیل دقیقی در مورد تصویرهای واحد یا چندتصویری که در کنار یکدیگر قرار می گیرند، وجود ندارد. روش فشرده سازی بر مبنای پردازشی ساده و ریاضی وار صورت می گیرد. بدین ترتیب یک پیکسل را به صورت یک دی میان روی خط های یکی در میان نمونه گذاری می کنیم. 

● انواع MPEG 
فشرده سازی MPEG-0 می تواند با بهره گیری از انواع گوناگون الگوریتم های کامپیوتری یا فرمول های ریاضی تصویرها را فشرده کند. این الگوریتم های متنوع به عنوان ابزار شناخته می شوند و می توان از ترکیب آنها برای فشرده سازی تصاعدی بدون از دست دادن کیفیت استفاده کرد. به بیانی دیگر، فشرده سازی MPEG-0 می تواند با بهره گیری از حدود چهار درصد اطلاعات ویدیو اصلی، تصویری با کیفیت خوب تولید کند. همچنین MPEG-0 انعطاف پذیر بوده و می تواند از روش های گوناگون اطلاعاتی، اندازه های تصویرها و کیفیت فشرده سازی حمایت کند. هر یک از فشرده سازی های MPEG که موفق بوده اند، (برای نمونه 7 و 5 و 4 MPEG) توانائی های بسیاری برای تشخیص اطلاعاتی که باید فشرده شوند، دارند. آنها همچنین می توانند با توجه به تصویر موجود، امکان فشرده سازی بیشتری را به تصویر بدهند. از انواع گوناگون تکنیک ها و روش های فشرده سازی MPEG می توان در کارهای کاربردی خاص استفاده کرد. 

● پردازش MPEG 
کار پردازش MPEG با بررسی سکانس هائی زا فریم های ویدیوئی که به جریان ویدیوئی معروف هستند، شروع می شود. اطلاعات زاید، کدگذاری و فشرده می شوند. سپس جریان ویدیوئی فشرده شده در یک بیت کدگذاری شده و جاری می شود و بیت جاری ذخیره شده یا انتقال می یابد. سرعتی که اطلاعات پردازش می شوند. به سرعت بیت معروف است. زمانی که از داده ها استفاده می شود یا تصویر را به حالت اولیه و اصلی خود ذخیره می کنیم، داده ها کدبرداری شده و از حالت فشرده درمی آیند. 
فشرده سازی MPEG از ترکیبی از دو برنامه گوناگون فشرده سازی، یعنی فاصله ای و موقتی استفاده می کند. فشرده سازی فاصله ای، داده های موجود در هر فریم ویدیوئی را با حذف داده های زاید موجود در تصویر کم می کند. فشرده سازی موقت نیز تفاوت های موجود بین تصویرها را در زمان های گوناگون مقایسه کرده و در نهایت داده هائی را که معرف تغییرات هستند، ذخیره می کند. فشرده سازی فاصله ای برای ساخت تصویر میانی، از همان تکنیک های موچود در فشرده سازی JPEG استفاده می کند که فریم I نامیده می شود. 
برخلاف فریم های موجود در فشرده سازی موقت، فریم های I تصویرهای ”مستقلی“ هستند که بدون نیاز به مراجعه به فریم ها قابل کدبرداری و نمایش هستند.
 
 فریم های I میان جریان ویدیوئی پراکنده شده اند و کاربردشان به عنوان مرجع فشرده سازی موقت در میان فریم ها است. مرتب کردن آنها درست همانند حصارکشی (نرده کشی) است، چرا که فریم های I، معرف نقاط محدودی در حصار هستند، در حالی که فریم های موقتی حصارهای بیشتری را دربرمی گیرند. 
فریم های فشرده سازی موقت که به فریم های B و P معروف هستند، شامل داده های حرکتی هستند که چگونگی تغییر نواحی فریم I بین فریم های میانی را بیان می کنند. فیرم های B و P نسبت به فریم های I اطلاعات کمتری دارند، چرا که تنها اطلاعاتی را درباره تغییراتی که بین فریم ها به وقوع پیوسته است، دربرمی گیرند و این از کارآمدترین بخش ها در کدگذاری MPEG است. نرخ فشرده سازی آن 25:1 است که سبب می شود در کیفیت عکس های فشرده نشده افت ایجاد نشود. فریم های B,I و P در زیر بیشتر توضیح داده می شوند. 

● فریم های I 
فریم I (فریم میانی Intra)، فریمی است که تصویر را به صورت کامل و با تمام جزئیات دربردارد و می توان از آن به عنوان مرجع فریم های دیگر استفاده کرد. فریم I به پیکسل های هشت قطعه ای (گروهی) تقسیم می شود. این قطعات پیکسلی در گروه های شانزده تائی که به قطعات بزرگتر معروف هستند، قرار می گیرند و سپس با بهره گیری از تکنیک های فشرده سازی JPEG فشرده می شوند. فریم های I بیشتر در زمان هائی ساخته می شوند که به آنها نیاز باشد یا تغییرات اساسی در محتویات تصویر صورت گرفته باشد که به طور معمول در جریان های ویدئوئی، این اتفاق دو بار در ثانیه رخ می دهد.
سرعت منتقل شده و داده ها را دریافت کنند تا تصویر را باز تولید کنند. سرعت و نرخ داده ها با نرخ بیت ها بنا به میزان پیچیدگی و کیفیت تصویر متغیر است. اگر تصویر پیچیدگی کمی داشته باشد یا کیفیت آن بالا نباشد، می توان از یک نرخ ثابت داده ها و بیت استفاده کرد. اما اگر تصویر پیچیده تر باشد یا کیفیت بالائی برای تصویر مورد نیاز باشد از سرعت های متغیر بیتی استفاده می کنیم تا نرخ کاهش یافته داده ها را زمانی که به کیفیت تصویر می پردازد، جبران کنیم. 

● نرخ های مختلف Bit 
اگرچه فایل ویدیوئی با سرعت ثابت فریمی حرکت می کند، اما میزان داده های لازم برای کدگذاری هر فریم بنا به پیچیدگی صحنهظها متغیر است. زمانی که پیچیدگی موجود در تصویر متغیر است. سرعت متغیر بیت ها می تواند کیفیت تصویر را ثابت نگه دارد. هر بخش از تصویر، بررسی شده و سپس با سرعت دلخواه فشرده می شود. بخش هائی از تصویر که پیچیدگی کمتری دارند. با سرعت بیشتری فشرده می شوند. در حالی که پیچیدگی بخش های دیگر از میزان سرعت فشرده سازی می کاهد. انواع مختلف سرعت های بیتی، عملیات کدگذاری را سخت تر کرده و کار در زمان مقرر تمام نمی شود. 
درست مانند روش IP، روش IBP نیز کارش را با فریم I شروع می کند. در مرحله بعدی آخرین فریم از GOP به عنوان نخستین فریم P استفاده می شود فریم P به فریم I و همچنین به بردارهای حرکت یکه زمینه پشتی و حرکت کامیون را توصیف می کند، اشاره می کند. در اینجا نیز همه ”سوراخ هائی“ را که در پس زمینه ایجاد شده اند، می توانید با گروهی از پیکسل های فریم I پر کنید. در این بخش فریم B با بهره گیری از بردارهای حرکتی که به اشیاء در حال حرکت اشاره دارد، ایجاد می شود. درست مانند روش IP حرکت و جابه جائی کامیون بخش های بدون پوششی را در زمینه پشتی مثل یک ”سوراخ“ باقی می گذارد با پر کردن ”سوراخ ها“ توسط گروهی از پیکسل هائی که در فریم I یا P وجود دارند، فریم B کامل می شود. 

● نرخ های بیتی ثابت 
سرعت های بیتی ثابت درجات گوناگونی و کیفیت تصویرها ایجاد می کنند. چرا که برای پیچیدگی تصویرها هیچ کاری جایز نیست. رسانه های گروهی همچون ماهواره و پخش های جهانی برای تجهیزات یانتقالی خود به سرعت های بیتی معینی نیاز دارید پخش زنده، ملاقات و نشست های ماهواره ای و در نهایت بازخوانی ویدیوهائی که فشرده شده اند، همه و همه به طول زمان واقعی برای فشرده سازی پیش از انتقال نیاز دارند. 
نرخ های بیتی ثابت برای فشرده سازی تصویرها و زمان واقعی آنها کاربرد دارند، در حالی که سرعت های بیتی گوناگون از انجام این کار عاجز هستند. 

● پروفایل ها و درجه بندی 
با ترکیب ابزارهای B,I و P، به تکنیک های فشرده سازی پیشرفته و تازه ای می رسیم که به پروفایل معروف هستند. بنا به پروفایلی که استفاده می کنیم، کیفیت تصویرها هم تغییر می کنند. پروفایل ها را می توان به درجات کیفیتی تقسیم کرد، البته با توجه به ابزارهای فشرده سازی که استفاده می کنند و پارامترهای فیزیکی ویدیوهای فشرده شده برای مثال اندازه تصویر، وضوح و نرخ بیتی برای بیان کیفیت تصویرها چهار درجه از تعریف محدود (وضوح ویدیوئی 4/1) تا تعریف بالا با حدود 1080 خط اسکن وجود دارد. هر یک از این درجه ها استانداردهای خاص خود را نسبت به ورودی ویدیوئی دارند. برای مثال ویدیوی Standard Definition یا ویدیوی High Definition. 

● پروفایل اصلی در سطح اصلی 
می توان پروفایل ها و درجه های گوناگونی را با هم ترکیب کرده و هماهنگ ساخت تا گستره متنوعی شامل اندازه های گوناگون تصویرها، سرعت های بیتی و کیفیت کدگذاری را در اختیار گرفت. کارآمدترین آنها معروف به Main Level در Main Profile است (Main Profile. (MP& ML به معنی آن است که از هر یک از فریم های B,I و P می توان برای فشرده سازی استفاده کرد و Main Level بدین معنی است که وضوح تصویر برابر با 480٭720 پیکسل در NTSC است. سیستم های دریافت و ذخیره سازی I,B و P به اندازه ای انعطاف پذیر هستند که MP @ ML می تواند به تنظیم نرخ های بیتی بپردازد. کاهش نرخ بیتی سبب کاهش کیفیت تصویر خواهد شد. البته این در صورتی است که از ابزارهای کدگذاری پیشرفته برای جبران این کار استفاده نشود. 

● کدگذاری و فشرده سازی ویدیوئی 
پس از تغییر علایم ویدیوئی RGB به داده های رنگدانه ای و روشنائی، بخش رنگدانه ای تصویر را می توان با کمی افت در کیفیت تصویر فشرده کرد. کانال های RGB به روشنائی (Y) و دو کانال رنگی (B-Y و R-Y) تبدیل می شوند. 
جدول بالا چگونگی دیجیتالی کردن برنامه را برای ویدیوی 4:2:2 نشان می دهد. برای هر چهار پیکسل روی خط اسکن، چهار نمونه دیجیتالی روی کانال روشنائی وجود دارد که تنها دو نمونه برای هر دوکانال رنگ بندی شده برداشته می شود. هر نمونه رنگی دو پیکسل در کنار خود دارد. در نتیجه، هر دو کانال رنگی در نصف وضوح کانال روشنائی، دیجیتالی می شود و داده های موجود برای آن دو کانال را تا پنجاه درصد کاهش می دهد. این کار سبب می شود که همه داده هائی که برای هر فریم ویدیوی مورد نیاز است تا 33% کاهش پیدا کند. نمونه 4:2:0 در نظر دارد کانال های رنگ بندی را یک قدم بیش از 4:2:2 جلو ببرد. اگر برای هر چهار پیکسل، چهار نمونه روشنائی و هیچ نمونه رنگی داشتیم، به نمونه 4:0:0 تبدیل می شد. البته مشخص است که اگر هیچ داده رنگی موجود نبود، تصویر شما سیاه و سفید می شد. اگر خطوط اسکن به صورت یک در میان در 4:2:2 دیجیتالی می شدند و خطوط میان آنها نیز روی 4:0:0 قرار می گرفتند، داده های رنگی از 4:2:2 خطوط اسکن به 4:0:0 خطوط اسکن متناوب می رسید، هر چند که میزان داده های موردنیاز برای توصیف فریم های ویدیوئی کاهش می یافت. 

برچسبها:

مشاهده سایر پروژه های درس آمار>>>>>
HyperLink