본문 바로가기
정보과학/영상통신시스템

(토론)시간적 데이터 중복

by J1소프트 2023. 10. 18.
728x90

1.서론

 

압축이란 데이터 양을 목표치에 근접하도록 줄이는 과정을 말한다. 그러나 압축 과정에서 원본 데이터가 갖고 있던 정보량이 크게 손상을 받는다면 효과적인 압축이라고 할 수 없다. 따라서 정보량의 손실이 전혀 또는 거의 발생하지 않도록 하면서 데이터 양만 줄이도록 데이터 압축이 수행되어야 한다. 

 

정보량의 손실없이 데이터의 압축이 가능한 것은 일반적으로 자연계에서 발생하는 데이터에는 중북성이 존재하기 때문이다. 중복성이란 동일한 데이터가 중복적으로 반복하여 발생하는 것을 의미한다. 

이러한 중복성은 제거되더라도 정보량의 손실을 발생시키지 않기 때문에, 데이터 속에 존재하는 중복성을 찾아서 제거하는 것이 데이터 압축의 기본 원리이다. 

 

일반적으로 비디오 데이터 속에는 공간적 중복성, 시간적 중복성, 그리고 통계학적 중복성 등 크게 세가지 종류의 중복성이 존재한다.

영상은 휘도(밝기)와 색차(색 정보)를 갖는데 휘도와 색차는 첫째 인접화소간의 값이 거의 비슷하기 때문에 화면내 공간적 상관관계를 이용하여 압축, 둘째 전화면(이전 프레임)의 정보를 저장하고 현화면을 전화면의 차분치로 표현하여 화면간 시간적 상관관계를 이용하여 압축하는 방법이 있다. 

그리고 두 가지 압축을 할때 생기는 부호의 발생확률이 다름을 이용하여 압축한다. 

 

- 공간적 데이터 중복성 제거 : 직교변환등을 통하면 화면에 불규칙하게 퍼져있던 화소값이 저주파항으로 밀집되는 경향이 있다. 이 값들을 다시 양자화과정을 거치면 고주파항들은 많은 부분이 0이 되어 압축을 할 수 있다. 

 

- 시간적 데이터 중복성 제거 : 영화필름에서와 같이 동영상은 조금씩 다른 화면을 차례로 디스플레이 함으로써 마치 연속된 것처럼 보이는 화면을 만들어낸다. 따라서 이웃하는 화면끼리는 매우 유사하다. 따라서 전화면 정보를 저장하고 있다가 현재 보내려는 화면과 비교하여 움직임이 있는 부분만을 움직임벡터라는 것을 이용하여 전송하여 전송량을 줄일 수 있다. 

 

- 통계적 데이터 중복성 제거 : DCT 계수나 움직임벡터등에 대해 발생확률이 높은 값에 길이가 짧은 부호를 할당하고, 출현확률이 낮은 값에 길이가 긴 부호를 할당하도록 부호기와 복호기사이에 새로운 부호체계를 세우면 평균부호길이를 줄일 수 있다. 이것을 가변장 부호화 또는 엔트로피 부호화라고 부른다. 

2.시간적 데이터 중복 제거

 

시간적 중복성이란 비디오를 구성하는 인접 프레임들 간에 존재하는 중복성을 의미한다. 

초당 30프레임의 비디오인 경우 인접 프레임간의 시간 차이는 1/30초이며 이웃한 프레임 사이의 상관성은 매우 높다. 

그러므로 원영상을 전송하는 것보다 인접 프레임간의 차영상을 전송하면 데이터 감축이 있을 것으로 쉽게 예상할 수 있다. 

 

[그림2]는 [그림1]의 비디오에서 인접 프레임간 차영상을 보여준다. 

그림에서 보듯이 차영상은 움직임이 발생한 영역에서만 큰 오차값이 발생하고 대부분의 배경 영역에서는 신호값이 없음을 알 수 있다. 따라서 적은 데이터 량으로 프레임간 오차 신호만을 전송하고, 수신단에서는 복원된 이전 프레임에 전송된 오차 신호를 더하여 현재 프레임을 재구성할 수 있다. 

 

[그림3]은 프레임간 오차 영상으로부터 현재 프레임을 재구성하는 과정을 보여준다. 이러한 과정은 일종의 시방향 DPCM으로 볼 수 있다. DPCM의 성능은 예측기의 우수성에 따라 달라진다. 앞에서 기술된 방식은 단순히 이전 프레임을 현재 프레임에 대한 예측 신호로 사용하는 방식이며 이러한 방식보다 더욱 우수한 성능을 갖는 시방향 예측기의 설계는 데이터 압축에 있어서 중요한 문제이다. 


대부분의 비디오 부호화기는 시방향 중복성 제거에 있어서 움직임 추정 및 보상 기법을 이용한다. 움직임 벡터를 이용한 영상 압축은 현재 영상을 전송하는 대신 움직임 백터를 전송함으로써 높은 압축률을 실현할 수 있는 알고리즘이다. [그림4]과 같이 배경 영역과 움직임 영역으로 구성된 영상의 경우 움직임 영역의 움직임 정보를 추정하여 움직임 영역에 대해서는 추정된 움직임 벡터만큼 이전 프레임을 움직임 보상한 후 예측하면 단순히 차영상에 의한 방식보다 예측 오차 신호의 에너지를 감소시킬 수 있다. 이 보상 오차는 움직임 백터만으로 현재 영상을 완벽히 재현할 수 없으므로 움직임 벡터와 별도로 전송한다. [그림5]은 움직임 백터를 이용하여 움직임 보상된 영상과 오차 신호를 보여준다.


실제 영상의 경우 한장의 영상은 다수의 물체를 포함하고, 다양한 움직임을 가지기 때문에 영상을 블록으로 분할하고 분할된 블록의 움직임 백터를 찾아서 전송하게 되는데 이를 블록기반 움직임 추정 및 보상 기법이라 한다.

 

 

3.멀티미디어 압축 기법

엔트로피 부호화 실행-길이 부호화(run-length coding)
허프만 부호화(Huffman coding)
산술적 부호화(arithmetic coding)
소스 부호화 예측기법 차분 펄스 코드변조(DPCM)
델타 변조(DM)
변환기법 퓨리에 변환(FFT)
이산 여현 변환(DCT)
계층적 코딩 비트 위치(Bit position)
서브샘플링(Subsampling)
서브밴드 코딩(Sub-band Coding)
벡터 양자화(Vector quantization)
혼합 부호화방식 JPEG
MPEG
H.261
DVI

A. 엔트로피 부호화
- 실행길이(Run-Lenght) 부호화
팩시밀리처럼 데이터에 특히 "0"이 많이 발생하는 경우, 혹은 만화영화나 악보처럼 한색이나 음이 긴 구간동안 지속될 경우 값 하나하나를 일일이 표현하는 것보다 어느 값이 얼마나 지속되는지 Run-length 로 표현하는 편이 효율적이다.

 

- 허프만 부호화(Huffman Coding)
서로 다른 문자들을 부호화할 때 고정된 비트 수를 사용하지 않고, 통계적인 분포를 이용하여 자주 나타나는 값에는 보다 적은 비트를, 드물게 나타나는 값에는 보다 많은 비트를 사용하여 부호화 함으로써 압축하는 기법

 

- 산술부호화(Arithmetic Coding)
입력신호의 발생 빈도로부터 입력신호의 확률을 추정하는 방식으로 복잡한 수학적 계산에 의해 부호화를 진행하며, Huffman 부호화 이상으로 좋은 성능을 나타내지만,  많은 곱셈계산을 필요로 하므로, 하드웨어 구현이 어려움

B. 예측(Predictive) 부호화
- PCM 방식
아날로그 신호를 디지털 신호로 바꾸어 얻음. 표본화 출력인 PAM(Pulse Amplitude Modulation) 신호가  양자화(Quantization) 과정과 부호화 과정을 거쳐 PCM 신호로 변환

 

- DPCM(Differnetial Pulse Code Modulation) 방식
인접한 신호간에는 일반적으로 상관관계가 매우 크므로, 이들 신호 각각을 부호화하는 것 대신에 이들의 차이값을 부호화하는 방식

 

- 델타변조방식(Delta Modulation:DM)
입력음성신호를 PCM이나 DPCM에 비해서 훨씬 높은 속도로 표본화하고, 대신 양자화 레벨의 수는 0과 1 두 가지만 갖게되는 방식

 

- 보코더(Voice coding and decoding:Vocoder)
음성 파형을 분석하여 유/무성음을 구별, 기본주기, 성도(vocal tract)의 형태모양 계수 등 음성의 특징을 추출하여 전송, 수신측에서는 반대로 이들 전송된 정보를 가지고 원래의 음성신호를 재생해내는 방식

 

- 복합형 부호화 방식
파형 부호화 방식과 음성 부호/복호기를 조합한 방식은 파형 부호화에 비해 전송속도가 훨씬 낮지만 시스템이 복잡

C. 변환(Transform) 부호화
파형 부호화 방식과 음성 부호/복호기를 조합한 방식은 파형 부호화에 비해 전송속도가 훨씬 낮지만 시스템이 복잡. 블록 양자화의 일종으로 시간 또는 공간영역의 입력신호의 스펙트럼을 분해(decomposition)함으로써, 변환이득을 통해 효율적인 감축이 가능하도록 함

D. 혼합 부호화
-JPEG (Joint Photographic Expert Group)
JPEG(Joint Photographic Coding Experts Group)은 컬러 정지 영상의 압축에 국제 표준으로서 1986년 ISO 와 CCITT(현 ITU-T) 합동 위원회 논의 결과 만들어진 정지 영상의 압축 알고리듬이다.

 

-H.261
멀티미디어 응용을 위한 초창기 동영상 부호화 방안, H.261에서 사용되는 움직임 예측 및 보상기법, DCT 부호화, 양자화, 허프만 부호화 등이 MPEG 알고리듬에도 그대로 적용

 

-MPEG1, MPEG2
첫 번째 MPEG표준안인 MPEG-1은 CD에 비디오를 저장하고 재생하기 위한 특정 응용제품을 위하여 개발되었다. MPEG-1 비디오는 블록 기반 움직임보상, DCT 그리고 양자화를 사용하며 약1.2Mbits/s로 압축된 비디오 비트율에 최적화되었다. MPEG-1은 PC와 웹 기반의 압축 비디오 파일 저장분야에 아직까지 널리 사용된다. MPEG-1에 이어 발표된 MPEG-

2 표준안은 디지털 TV 방송의 지원을 목표로 하여 MPEG-1에 기반을 두었지만 비월주사 비디오의 효과적인 압축, 보다 유연한 문법, 압축 효율의 향상과 더 유연하고 강력한 기능을 포함하여 VHS 비디오테이프를 대체하는데 성공하였다고 평가를 받고 있다.

4.결론 및 의견


시간적 데이터 중복성에 대한 내용에 앞서 멀티미디어의 압축과 근본적인 문제인 압축를 해야 하는 이유부터 영상의 특징적인 화소와 프레임 그리고 DCT계수와 움직임 백터 등을 이용한 시간적 중복성, 공간적 중복성, 통계적 중복성에 대한 이해를 서론부에서 먼저 집어 보았다.


다음으로 시간적 데이터 중복성과 이들 부호화 방식에서 사용되어지는 멀티미디어 압축 알고리즘을 엔트로피 부호화, 예측 부호화, 변환 부호화, 혼합 부호화로 세분하여 각 알고리즘의 개념을 살펴보았다.

 

시간적 중복성 제거 알고리즘에서는 비디오를 구성하는 인접 프레임들 간에 존재하는 중복성을 원영상과 인접 프레임간의 차영상을 전송하여 데이터를 압축하는 기법이며, 이 부분을 이해하며 유년때 책에 한 귀퉁이를 여러 페이지에 걸쳐 비슷한 그림을 그리고 해당 면을 빠르게 넘기며 움직이는 영상을 만들던 때를 회상하게 했다.