Dijital Sıkıştırmanın Derin Sırlarına Uzman Gözüyle Bakış.Clive J. Grove

guclusat · 3 Eylül 2010

MPEG teknolojisi veri indirgeme tekniği üzerine kuruludur. Orijinal sinyal bir veri akımına dönüştürülür ve daha sonra sıkıştırılarak indirgenir. Elde edilen sinyal, eski haline çevrildiğinde daima orjinale en yakın görüntü elde edilir. Yani, sistemde kayıplar olur; ancak bu kabul edilebilir seviyelerde kalır; çünkü insan gözü toleranslı bir organdır ve tipik olarak 120.000 örnek içinde yalnızca bir hatayı tespit edebilir. Kulak ise 1.5 milyan örnekten yalnızca bir hatayı bulabilir. Bu nedenle MPEG formatında, ses farklı bir şekilde işlenir.

Tüm “PEG’ler” aynı temel indirgeme sistemini kullanır. Aralarındaki farklılıklar yalnızca ayrıntıdadır. DVB S veya S2, sinyal arızalarını düzeltme teknikleridir. Sinyal, elektronik olarak temiz bir ortamda yaratılır. Transmisyon ise son derece gürültülü bir ortamda gerçekleşir.
Her türlü gürültü ve parazitle karşılaşmak mümkündür. Sinyalin buna hazırlanması gerekir. Kaçınılmaz olarak, orijinal verinin elde edilmesinin ödenmesi gereken bir bedeli vardır. Bu noktada, DVB-S ve DVB-T formatlarının sinyalleri çok farklı şekilde işlediklerini belirtelim. “Büyülü Kurşun” DCT: Discrete Cosine Transform (Farklı Kosinüs Dönüşümü). Bunun nedeni DCT’nin, bir görüntüye ilişkin görsel bilginin çoğunu yalnızca bir iki katsayı kullanarak aktarabilmesidir. Özünde aynı hesaplamayı yapmakta kullanılan Discrete Fourier Transform (Farklı Fourier Dönüşümü)’den ayrıldığı nokta ise, bu yöntemin çok daha fazla sayıda bileşenler kullanmasıdır. Buna bağlı olarak, sağladığı sıkıştırma seviyesinin verimi de düşer. DCT, bir çok güçlü sıkıştırma aracından oluşan bir çantanın içinde yer alan yalnızca tek bir bileşendir. Bir blok yapısı uygulanır ve 64 makro blok yaratılır. Sonuç olarak her bloğa DCT uygulanmış olur. Bu işlem, frekans zaman alanındaki makro blokları, uzamsal frekans katsayılarına dönüştürür. Bu işlem veriyi büyük ölçüde sıkıştırır. Geriye, frekans bileşenlerinin düşürülmesi işlemi kalır. Elde edilen DCT değerleri yüklenir. RGB değerleri siyah beyaz ölçeğine dönüştürülür. Bu yöntem Mavi ve Kırmızı renkler için kullanılır ve yarı bant genişliğinde yeniden çözülür. Tüm kalan diğer bileşenlerin miktarı sıfıra yakındır. Ancak bu önemsiz kabul edilir ve sistem paraziti olarak dışarı atılır. 64 makro bloğu 8x8 piksel bloklarıdır ve bu bloklar frekans içeriğinde yatay ve dikey olarak yükselir. Bunların içinde mevcut bütün istatiksel şekiller bulunur. Sistem, görüntü makro bloğuna en yakın katsayıya sahip bir bloğu seçerek bunu DCT’ye uygular. Görüntü bilgisini tekrar elde etmek için her blok DCT ağırlığından giderek tespit edilir ve sonuçta orijinal görüntü elde edilir. Şimdi her DCT değerini bir tamsayı ile ile nicelendiririz. Bu, netlik kaybına neden olur ve tipik olarak geriye sıfır olmayan yalnızca birkaç katsayı bırakır. Şimdi yapılması gereken, nicelendirilmiş katsayıları çapraz bir sırayla taramaktır. Bunun sonucunda, sıfıra eşit olmayan tüm katsayı-lar bir araya toplanmış olur. Çalışma seviyesi çözümleme işlemi uygulanır. Bu işlemle bir dizi sayı çifti üretilir. İlk değer, önceki sıfırların sayısını; ikinci değer, sıfır olmayan sayıların adedini gösterir. Elde edilen dizi, artık kolaylıkla Entropi çözücüsüne uygulanabilecek durumdadır. Bu işlem, kısa bir kodu sıklıkla oluşan gruplara; uzun bir kodu da bazen ortaya çıka-ran gruplara atar. Sonuç daha da sıkıştırılmış bir görüntüdür. Bunun dışında hareket tahmini için kullanılan aletler de bulunur. Önceki resim çerçevesi, mevcut çerçeveden çıkartıldığında veri miktarı önemli ölçüde indirgenebilir. Artık görüntü, önceki çerçeve ile mevcut çerçeve arasındaki farkı oluşturan küçük miktardaki veriden ibarettir. Bu, genel olarak 16x16’lık aydınlık blokların aynı anda işlenmesiyle elde edilir. Bunlar, önceki çerçevede komşu bölgelerle karşılaştırılır. En yakın eşleşen bulunduğunda referans bölge olarak kabul edilir. Mevcut Makroblok ile referans öngörü bölgesi arasındaki fark hesaplanır. Bu daha sonra hareket vektörü olarak alınır. Mevcut makrobloktan referans bölgeyi çıkartıp, fark makrobloğunu bir çözücüyle çözeriz. Bunun anlamı, fark makrobloğunda çok az artık verinin kalacağıdır. İlave araçlar, çerçeveler arası işlemlere ilişkindir. Tipik olarak bir çözücü 12 çerçevelik gruplarla çalışmak üzere ayarlanır. Bunlar I çerçeve (İç çerçeve) olarak adlandırılır. Bunlar yalnız başlarına gruplar şeklinde sıkıştırılır. Diğer çerçevelerle doğrudan bir bağlantıları yoktur. Bu nedenle, mümkün olan en yüksek miktarda veriyi içerirler. P Çerçevesi (Öngörülen Çerçeve) daha önceki bir çerçeveye referansla öngörülebilen çerçevedir. B çerçeve (Ara Çerçeveler) her iki komşu çerçeveye referansla öngörülen çerçevedir. P ve B çerçevelerin kullanılmasının, resim sıkıştırmayı büyük ölçüde geliştireceği açıktır; çünkü yalnızca çerçeveler arasındaki farklılıkları içerirler. Genel terimlerle söylenecek olduğunda, televizyon çerçeveleri arasında çok küçük bir değişiklik söz konusudur. Bu nedenle aktarılması gereken veri yalnızca mevcut görüntü çerçevesi ve öngörülen çerçevedir. DVB, ETSI, ITU vs. tarafından yayınlanan çeşitli dokümanlar, üreticilerin çözücü ve şif-releyicileri nasıl imal edeceklerini tarif ediyor. Bu dokümanlarda MPEG sistemlere ilişkin rehberler ve algoritmalar bulunuyor. Bu nedenle piyasada bulunabilen bilgiler, yalnızca mevcut cihazların giriş ve çıkışları üzerine genel açıklamalarından ibaret. Kullanıcıların yetenek düzeyine göre çok büyük farklılıklarla karşılaşmak mümkün.
MPEG 2 yalnızca üç seviyede giriş sunuyor.
Düşük Seviye 360x288 (VHS seviyesi).Ana Seviye 720x576 (Yayıncılık).Yüksek Seviye 1920x1152 (HD ve uzmanlık uygulamaları için).
Bunların dışında, parlaklık/krominans örnekle yapısı tanımlanmıştır: 4:4:4, 4:2:2, ve 4:2:0.Gerçek dünyada, en fazla kullanılan çözünür-lük, MP@ML adıyla bilinen 4:2:0’lık 720x576 çözünürlüğüdür. 4:2:2 ancak son zamanlarda gerçek kapasitesiyle kullanılabildi. Eskiden yalnızca önemli yayınlarda kullanılırdı. Normal olarak çözücülerin çoğu MP@ML moduna geçirildiğinde kendiliğinden otomatik çözünürlüğe geçerler. Bu modayken, çözücü giriş saat hızını gelen görüntüdeki ayrıntıya göre ayarlar. Böylece, parametrelerini maksimize eder ve bununla birlikte sıkıştırma işlemi de iyi bir şekilde başarılmış olur. Kayıt taşmaları bu yöntemle engellenir ve cihaz çok düşük ve giriş saat hızından kaynaklanan bloklamayı da önlemiş olur. 0.5 Mb/sn seviyesinde çok düşük bit hızına sahip çözücüleri test ettim. Tipik bir görüntüde hiçbir bloklanma veya kusur yok. Ancak bazı “MPEG kusurları”nın varlığı da bir gerçek. Aşırı kenarların bulunduğu bazı görüntülerde, örneğin uzun otlarla kaplı bir çayır görüntüsünde sistem devreye girerek, bütün otların aynı yapı, açı ve biçimde olduğu yanlış bir görüntü üretebilir. Diğer bir örnek de okyanus görüntüsüdür. Dalgaların gösterildiği bir ekranda belirli mesafelerde, MPEG devreye girer ve bütün dalgaların birbirinin aynı olduğu bir görüntü ortaya çıkarır. Son olarak bir ateşin alevleri de belirli durumlarda sorun yaratabilirler. Tüm bu örnekler aslında nadiren karşılaşılan şeyler olsa da çok düşük veri hızları kullanıldığında meydana gelmeleri her zaman mümkündür. Düşük veri hızlarında sıkıştırma için kullanılan bir diğer araç da İstatiksel Çoğullamadır (yayın buketinin oluşturulması için de kullanılır). Normal olarak bir MPEG sinyali oluşturulduktan sonra çoğullaştırıcı yardımıyla modüle ve onun kapasitesine uyumlaştırılır. İstatiksel Çoğullama kullanıldığında, önce sinyal bir giriş işleminden geçirilir, daha sonra tüm tablolar ve bilgiler buna gore oluşturulur. Sıklıkla, bir sonraki adımda bit dolgulama yöntemi kullanılır. Bunun amacı, sonucu dengelemektir. Böylelikle yüksek bit hızlarında sabit bir taşıma oluşturulur. Yüksek kaliteli modern bir çözücü, genel kabul gören yaygın bir spor türü olan futbol müsabakalarını MPEG 4:2:2 formatında modülatörü 3 MHz ve ¾ FEC ile gösterebilir. Bu ayarlarda hiçbir bloklama, kenar (ya da buzlanma) çözünürlüğü etkilemez. Bunu değişik ayarlarla test ettim. Şimdi artık S2’de AVC (H264) moduna doğru geçebiliriz. Ancak, bunun saati geriye çevirmek gibi bir etkisi olabilir. Daha önce de belirttiğimiz gibi, “her şey ayrıntıda gizli”. AVC ile mobil bir makroblok yapısı işleme konur. Çözücü hızlı bir şekilde hangi görüntülerin anlamlı olduğuna ve bunların boyutlarına karar vermek zorundadır. Maksimum 32 görüntü çerçevesi eş zamanlı olarak depolanır. Sistem daha sonra bu blok üzerine DCT analizi oluşturur. Sonucu interaktif bir depo olan “Bin”de depolar. Ardından gelen çerçeveler bu bilginin bulunması ve tekrar gösterilmesi gerekir. Belirli bir noktada konserve edilmesi ve yeni bir makrobloğun yakalanması gerekir. Günümüzde bu durum bir çok üreticide büyük bir şaşkınlığa yol açmaktadır. Yeni AVC alt 1 MHZ SD ve 2Mz HD vaadinde bulunuyor. Ne yazık ki, ben bu ideale ulaşmanın birkaç yıl alacağını düşünüyorum. Şimdilik MPEG 2’nin S2 ile kullanılmasında herhangi bir sınırlama yok gibi görünüyor. Bu nedenle 1 MHz altında kanallar ortaya çıkacaktır, tabii ki uydu alıcısı üreticileri bu standartları yakalayabilirse.

Dijital Sıkıştırmanın Derin Sırlarına Uzman Gözüyle Bakış.Clive J. Grove

guclusat

Tanınmış Üye

Eklentiler