본문 바로가기
정보과학/영상통신시스템

디지털 영상

by J1소프트 2023. 9. 15.
728x90

1. 인간 시각의 영상 인지 특성


영상통신 시스템은 사람이 보는 시각 정보를 전달한다. 그러므로 시각의 기본 원리를 이해하면 영상통신 시스템을 구성하는 요소들의 설계나 이해에 도움이 된다. 여기에서는 사람 눈의 개략적 구조와 시각 현상들을 통하여 이러한 의미를 찾아보려고 한다.


1.1 눈의 구조

□ 수정체를 통해 들어온 빛은 망막에 상을 맺는다.

□ 망막에는 원추형의 원추세포(cone)와 막대 모양의 간상세포(rod)라는 두 가지 시세포가 있다.
     ▷ 간상세포 : 어두운 빛에서 반응한다.
     ▷ 원추세포 : 밝은 빛에서 반응하며, 세 가지 파장에 반응하는 세 가지 광색소를 가지고 있어
색을 감지할 수 있다.
□ 망막 중심부의 황반은 가장 시력과 색각이 예민한 부분으로, 그 중심부에 원추세포가 집중되어
있고, 주변으로 갈수록 원추세포의 수는 급격히 감소하고 간상세포의 밀도가 증가한다.

1.2 삼원자극이론(Tristimulus theory)

□ 원추세포는 빛의 파장에 따라 흡수도가 다른 세 종류의 광색소가 있으며, 각각 440nm, 545nm, 580nm 근방에서 흡수율이 가장 높다.
□ 파장에 따른 광색소들의 흡수율을 각각 R(λ), G(λ), B(λ)라 할 때, 임의의 색을 갖는 빛 C(λ)에 대해 각각의 광색소가 흡수하는 빛의 양은 다음과 같다.

r(C) = R(λ)C(λ)dλ
g(C) = G(λ)C(λ)dλ
b(C) = B(λ)C(λ)dλ

□ 인간의 시각은 r(C), g(C), b(C)의 값에 따라 색을 느낀다고 알려져 있다.
⇨ r, g, b 값이 같다면 색을 구성하는 주파수 성분이 다르더라도 같은 색으로 인지될 수 있다는 것을 의미한다.

1.3 휘도(luminance)의 인식 - 동시대비효과
□ 물체의 휘도(luminance)는 물체에 조사되는 빛의 조도(illuminance)와 물체 표면의 반사율(reflectance)에 의해 결정된다.
L(x, y) = E(x, y)․R(x, y)
여기에서 L(x, y)는 휘도, E(x, y)는 조도, R(x, y)는 반사율
     ▷ 휘도는 물체 주변의 휘도와는 관계가 없다.

□ 그러나 사람이 느끼는 휘도(인지휘도; brightness)는 물체 주변의 휘도에 따라 다르게 느낀다.
다음의 예는 동시대비효과(simultaneous contrast effect)로 잘 알려진 것으로, 휘도 인지과정의 공간적 상호작용을 보여준다.

※ 용어
▷ 휘도(luminance) : 물체의 표면으로부터 눈으로 들어오는 가시광의 양
▷ 조도(illuminance) : 물체의 표면에 입사되는 빛의 양
▷ 반사율(reflectance) : 표면에 입사되는 빛과 반사되는 빛의 비율
▷ 밝기(lightness) : 인지된 표면의 반사율
▷ 인지휘도(brightness) : 영상 자체로부터 들어오는 빛의 인지 강도. perceived luminance라고도 한다.


1.4 휘도(luminance)의 인식 - 마하밴드
□ 휘도가 변하는 경계 부분에서 인지하는 강도는 같은 휘도영역 내에서도 다를 수 있다.
□ [그림5]에는 휘도가 균일한 네 개의 띠가 그려져 있다. 그러나 A 영역 내에서 인지되는 휘도는 B 영역과의 경계 부근에서 더 어둡게 느껴진다. 마찬가지로 B 영역 내에서 인지되는 휘도는 A 영역과의 경계 부분에서 더 밝게 느껴진다.
□ 이와 같이 휘도의 공간적 상호작용으로 나타나는 이러한 현상을 마하밴드(Mach band) 효과라고 한다.

□ 마하밴드 효과는 휘도가 계단형으로 변화하는 경우뿐만 아니라, 휘도가 서서히 변화하는 경우에도 나타난다. [그림6]에서 휘도는 좌에서 우로 단조증가하고 있다. 그러나 실제는 a 부분이 더 어둡게, b 부분이 더 밝게 느껴진다.


1.5 공간주파수 응답
□ 휘도의 변화를 인지하는 대비 감도는 휘도 변화 주파수에 따라 다르다.
□ [그림7]의 영상은 정현파 형태로 변화하는 줄무늬 영상으로, 좌에서 우로 갈수록 공간주파수가 증가한다. 또한 아래에서 위로 갈수록 휘도 진폭이 감소한다. y 좌표의 값이 동일한 수평선상의 휘도 변화 진폭은 동일하다.
□ 이 때 휘도의 대비를 느낄 수 있는 정도는 휘도의 공간주파수에 따라 다른 것을 느낄 수 있다.
영상을 보는 위치나 사람에 따라 다를 수 있지만, 대체로 낮은 주파수 영역이나 높은 주파수 영역에 비해 가운데 부분의 주파수 영역에서 대비 감도가 높은 것을 관찰할 수 있다.
□ 이와 같이 시각의 공간주파수 특성은 대역통과(bandpass) 특성이 있으며, 일반적으로 3~10cycles/degree에서 최대값을 보인다.


1.6 시각의 시간적 인지 특성
□ 인간의 시각은 휘도나 색이 다른 두 종류의 빛이 교대로 천천히 깜박이면 이를 감지한다. 그런데, 반복 주파수를 증가시키면 어느 주파수 이상부터는 빛이 항상 켜져 있는 것처럼 깜박임을 느끼지 못하게 되는데, 이와 같은 현상이 발생하는 최소 주파수를 임계융합 주파수(critical fusion frequency; CFF)라고 한다.
□ 인간의 눈은 낮은 휘도보다 높은 휘도에서 깜박임을 잘 느끼는데, 텔레비전에서 가장 밝은 부분을 보는 경우 24Hz 부근에서 가장 예민하고, 70Hz를 넘어서면서부터는 깜박임을 느끼지 못하게 된다.


2. 디지털 영상


실세계에 존재하는 시각 정보를 컴퓨터로 처리하기 위해서는 아날로그 시각 신호를 디지털 값으로 변환해야 한다. 이러한 변환을 하기 위해서는 실세계의 장면에 대해 표본화(sampling)와 양자화(quantization)라는 처리를 거치게 된다. 여기에서는 이와 같은 영상 취득 과정과 함께, 색상의 표현 방법에 대해 소개한다.


2.1 디지털 영상의 정의
2.1.1 공간적 표본화
□ 표본화는 연속적인 신호를 정해진 시간 간격으로 구분된 이산적인 신호로 변환하는 과정을 의미한다. 

[그림10]에서는 시간에 따라 연속적으로 변하는 신호 f(t)로부터 정해진 시간 간격 Δt로 값을 취하는 표본화를 함으로써 이산적인 신호 fd(t)를 구하고 있다.
□ 만약 신호 f(t)가 주파수 B에서 대역제한되어 있다면(그 신호에 포함된 가장 높은 주파수 성분이 B 이하라면), 표본화 주파수 fs = 1/Δt가 fs ≥ 2B일 경우 표본화된 신호 fd(t)로부터 원래의 신호 f(t)를 복원할 수 있다는 것이 입증되어 있다. 이를 나이키스트 표본화 정리(Nyquist sampling theory)라고 한다. 그러나 fs < 2B일 경우에는 원래의 신호를 완전히 재현할 수 없게 된다.

□ [그림11]은 동일한 영상을 네 가지 해상도로 표본화한 예를 보여준다.
□ 표본화율(sampling rate)이 나이키스트 표본화율보다 낮아지면 원래의 영상이 복원되지 못하며, 그에 따른 왜곡 현상이 나타나게 된다. 이러한 현상을 에일리어싱(aliasing)이라고 한다.
[그림12]는 이러한 에일리어싱 현상을 보여주는 예이다.


2.1.2 양자화
□ 표본화된 이산신호는 임의의 정밀도를 갖는 값이나, 컴퓨터에서는 무한한 정밀도의 값을 표현할 수 없으므로 이를 유한한 개수의 값으로 근사화 하여 표현한다. 이러한 처리를 양자화(quantization)라고 한다.
□ [그림13]에서 표본화된 신호 fd(t)의 각각의 값들은 임의의 정밀도를 갖는 값이다. 이를 양자화 하기 위해서는 신호 값의 범위를 정해진 개수의 구간으로 나눈다. 각각의 표본들의 값은 이 구간들 중 하나의 구간에 속할 것이며, 원래의 값 대신 그 구간을 대표하는 값으로 표본의 값을 표현함으로써 양자화된 신호 fq(t)를 얻을 수 있게 된다.

□ 이러한 양자화 과정은 원래의 값이 그 값이 속한 구간의 대푯값으로 대체되므로 오차를 유발할 수밖에 없는데, 이러한 오차를 양자화 오차(quantization error)라고 한다.
□ [그림14]는 영상을 각각 256단계, 32단계, 8단계, 4단계의 구간으로 양자화한 결과를 보여준다. 양자화 단계 수가 줄어듦에 따라 밝기 단계가 불연속적으로 변화하는 현상이 두드러지게 보인다. 이러한 차이는 양자화 오차에 기인한 것이다.

□ 양자화된 값을 표현하기 위해 필요한 비트 수는 양자화에 적용된 구간의 수에 의존한다.

모든 값들을 동일한 길이의 비트로 표현할 때 m단계의 값을 표현하기 위해 필요한 비트 수 n은 다음과 같다.

 

n = ceil(log2m), 여기서 ceil()은 자리올림 연산을 의미함

 

□ 따라서 양자화 단계수를 줄이면 값을 표현하는데 필요한 비트 수가 줄어들어 저장 공간 소요량이 줄어들지만, 양자화 오차가 커지게 된다. 양자화 오차는 되돌릴 수 없다.

 

2.1.3. 디지털 영상
□ 어느 순간의 한 장면을 표본화와 양자화를 통해 디지털 데이터로 변환하면 일련의 점들로 구성된 한 장의 디지털 영상이 형성된다. 각각의 점들은 2차원 직교좌표공간에 사상된다. [그림15]는 가로 44개, 세로 36개의 점으로 구성된 디지털 영상이다. 좌표 (x, y)에 위치한 점의 휘도, 또는 색상을 f(x, y)로 나타낼 수 있다.

□ 한 화면의 가로 및 세로 점의 수는 표본화율에 따라 결정되며, 양자화 구간의 수에 따라 한 점이 표현할 수 있는 값의 정확도가 결정된다.
□ 각각의 표본점들을 화소(pixel; picture element)라고 부른다. 화소의 밀도를 나타내는 말로 해상도(resolution)라는 용어를 사용하는데, 단위 길이 안에 몇 개의 점을 구분하여 표현할 수 있는가를 나타내기도 하고, 영상을 구성하는 가로 및 세로 화소수를 나타내기도 한다.


2.2 시간적 표본화
2.2.1 프레임률
□ 비디오 영상은 시간적으로 변화하는 장면들이 모여 구성된다. 연속되는 비디오 영상들은 실세계의 장면을 정해진 시간 간격으로 직사각형 영상을 ‘찍음’으로써 얻는다. 따라서 이러한 과정을 시간적 표본화라고 한다. 연속적인 한 장 한 장의 영상을 프레임(frame)이라고 하며, 이 프레임들을 연속적으로 보여주면 움직이는 영상을 볼 수 있다.
□ 단위 시간에 몇 장의 프레임을 취득하는가를 프레임률(frame rate)이라고 한다. 프레임률을 높이면 부드러운 움직임을 얻을 수 있지만, 더 많은 데이터를 저장하거나 전송해야 한다.
□ 초당 10프레임 이하의 프레임률은 움직임이 자연스럽지 못하지만, 데이터 양이 매우 적어야 하는 초저전송률의 비디오 통신에서 사용될 수 있다.
□ 저전송률 영상 통신에서는 초당 10~20프레임의 프레임률을 사용하며, 빠른 움직임이 포함된 영상의 경우 부자연스럽게 보일 수 있다.
□ 컬러텔레비전의 경우 NTSC 시스템에서는 30프레임/초의 프레임률을 사용하고 있으며, PAL 및 SECAM 시스템에서는 25프레임/초이다.


2.2.2 순차주사 및 비월주사
□ 프레임을 구성하는 방식은 한 번에 하나의 프레임을 완전히 구성하는 순차주사(progressive scanning) 방식과 홀수 주사선과 짝수 주사선으로 구분된 두 개의 필드로 구성하는 비월주사(interlaced scanning) 방식이 있다.
□ 순차주사 방식
     ▷ 화면의 위에서 아래로, 좌에서 우로 신호를 주사하여 한 번에 한 장의 프레임을 구성한다.
     ▷ 따라서 순차주사 방식의 동영상은 완전한 한 화면의 영상이 연속적으로 전달된다. 
□ 비월주사 방식
     ▷ 한 프레임을 홀수번째 주사선들의 집합으로 구성된 홀수필드와 짝수번째 주사선들의 집합으로 구성된 짝수필드라는 두 개의 필드로 구분한다. 이러한 방식을 2:1 비월주사라고 한다.
     ▷ 영상을 취득할 때 정해진 시간 간격으로 홀수 필드와 짝수 필드를 번갈아 표본화하며, 이를 디스플레이할 때는 홀수필드와 짝수필드를 번갈아 보여준다.
     ▷ 비월주사를 할 경우 한 프레임 시간 간격 동안 두 개의 필드를 보여줌으로써, 전송하는 데이터의 양은 순차주사와 동일하지만, 두 개의 화면을 보여주는 것과 같은 효과가 있다. 따라서 더 부드러운 움직임을 표현할 수 있다.

 

2.3 색 공간
2.3.1 RGB 색 좌표계
□ 빛의 삼원색인 적(Red), 녹(Green), 청(Blue)색의 상대적 비율을 나타내는 세 개의 숫자로 색을 표현한다. RGB 색 좌표계는 컴퓨터 그래픽, 컬러 카메라 등의 일반 응용에서 흔히 사용된다. 컬러 CRT나 LCD는 각 화소의 R, G, B 성분의 값에 따라 색의 강도를 조절하여 영상을 디스플레이 한다.
□ RGB 색 모델에서는 세 가지 색 요소들을 동일하게 취급하여 모두 같은 수의 비트로 표현한다.
그러나 사람의 눈은 색보다는 휘도에 더욱 민감하기 때문에 이와 같은 표현 방식은 적절하지 않다. 영상부호화 방식이나 텔레비전 방송 시스템에서는 휘도신호와 색도신호를 사용함으로써 색도신호보다 휘도신호에 더 많은 비트나 대역폭을 할당할 수 있도록 한다.


2.3.2 YUV 색 좌표계
□ NTSC, PAL, SECAM 등의 컬러텔레비전에서 사용하는 기본적인 색 형식이다.

Y는 휘도성분이며, U와 V는 색도성분이다.
□ RGB 색은 다음과 같은 식에 의해 YUV 값으로 변환된다.

     Y = 0.299R + 0.587G + 0.114B
     U = -0.147R - 0.289G + 0.436B = 0.492(B - Y)
     V = 0.615R - 0.515G - 0.100B = 0.877(R - Y)

2.3.3 YCbCr 색 좌표계
□ NTSC, PAL, SECAM에서 서로 호환되는 디지털 신호를 개발하기 위해 ITU-R BT.601에서 표준으로 채택한 색 좌표계이다. Y는 휘도, Cb, Cr은 색도신호이다.
□ RGB 색은 다음과 같은 식에 의해 YCbCr 값으로 변환된다.

     Y = 0.299R + 0.587G + 0.114B
     Cb = -0.169R - 0.331G + 0.500B = 0.5(B - Y) / 0.886
     Cr = 0.500R - 0.419B - 0.081B = 0.5(R - Y) / 0.701

□ 역으로 YCbCr 값을 다음 식에 의해 RGB 값으로 변환할 수 있다.

     R = Y + 1.402Cr
     G = Y - 0.344Cb - 0.714Cr
     B = Y + 1.772Cb

 

2.3.4 YCbCr 표본화 형식
□ 인간의 시각 시스템은 휘도에 비해 색상에 덜 민감하기 때문에, Cb와 Cr 성분을 Y보다 낮은 해상도로 표현해도 시각적으로 화질의 차이를 잘 느끼지 못한다. 그러므로 활용분야에 따라 여러 가지 형식으로 색도신호 표본화를 할 수 있다.

□ 4:4:4 표본화 형식 : 4개의 Y 표본에 대해 4개의 Cb 표본과 4개의 Cr 표본이 존재하는 형식으로, 색도신호를 그대로 보존한다.
□ 4:2:2 표본화 형식 : 색도신호의 수평해상도는 휘도신호의 수평해상도와 동일하나, 색도신호의 수직해상도는 휘도신호의 반이다. 즉, 수평방향으로 4개의 Y 표본마다 2개의 Cb 표본과 2개의 Cr 표본이 존재하는 형식이다.
□ 4:2:0 표본화 형식 : Cb 표본과 Cr 표본의 해상도는 수평과 수직에 대해 모두 반이다.
□ 비월주사의 4:2:0 표본화 형식 : 하나의 프레임에 해당되는 Y, Cb, Cr 표본이 두 개의 필드에 분배된다.


3. 비디오 형식

지금까지 비디오 신호를 표현하는 기본적인 도구는 텔레비전이므로, 텔레비전에서 영상을 표현하는 방식은 영상통신 시스템에도 영향을 미치고 있다. 여기에서는 디지털 텔레비전을 위한 영상의 형식 및 중간 공통 형식(CIF)에 대하여 소개한다.

 

3.1 디지털 스튜디오 영상 코딩 형식

□ 아날로그 컬러텔레비전 표준 방식은 NTSC, PAL, SECAM 방식이 있다.
     ▷ NTSC(National Television Systems Committee) 방식 : 미국에서 개발되어 우리나라와 미국, 일본, 남아메리카, 대만 등에서 사용되고 있다.
     ▷ PAL(Phase Altering Line) 방식 : 독일에서 개발되어, 서유럽 국가, 중국, 북한 등에서 사용되고 있다.
     ▷ SECAM 방식 : 프랑스에서 개발되어, 러시아, 동유럽 국가, 호주, 뉴질랜드 등에서 사용되고 있다.
□ ITU-R BT.601은 NTSC, PAL, SECAM 방식에서 서로 호환되는 디지털 신호를 얻기 위해 1982년 ITU-R 권고 BT.601-5를 제시하였다. 4:2:2 형식에 대한 기본 파라미터는 다음과 같다.


30Hz 프레임률 시스템 25Hz 프레임률 시스템
초당 필드 수 60 50
총 주사선 수 525 625
프레임 당 활성 유효 주사선 수 486 576
주사선 당 총 표본 수
휘도(Y)
색도(Cb, Cr)

858

429

864

432
표본 당 비트 수 8
주사선 당 유효 표본 수
휘도(Y)
색도(Cb, Cr)

720

360


3.2 공통 중간 형식
□ 영상전화와 같은 영상통신 시스템에서는 카메라나 모니터 등은 기존 TV 방식을 따르는 장비들을 사용하므로, NTSC, PAL, SECAM과 같이 방식이 다른 지역과 직접적인 통신을 할 수 없는 문제가 발생한다. 이러한 문제를 해소하기 위해 CIF(Common Intermediate Format; 공통 중간 형식)라는 영상 형식을 규정하였다.
□ CIF의 해상도는 352×288이며, 크기가 CIF의1/4인 QCIF(Quater CIF)는 176×144이다.
□ 영상전화를 위한 영상부호화 표준기법인 H.261에서는 QCIF 형식을 지원하도록 하고 있고, CIF 형식의 지원 여부는 선택사항이다.


4. 화질

영상 시스템은 결국 사람이 보기 위한 영상을 제공한다. 그런데 효율적인 영상 데이터의 전달이나 보관이 효율적으로 이루어지도록 하기 위해서는 원래의 데이터를 부호화하는 과정을 거치게 되는데, 이때 화질이 저하되는 문제가 발생할 수 있으며, 이를 평가할 수 있는 기준이 필요하다. 이 절에서는 화질을 평가하기 위한 주관적 방법과 객관적 방법에 대하여 고찰해 본다.


4.1 주관적 화질 측정
□ 인간의 시각 시스템은 눈과 두뇌의 복잡한 상호작용에 의해 시각적 장면을 이해한다. 따라서 화질에 대한 평가는 원본과 부호화된 영상의 수치상의 차이뿐만 아니라, 시각적 관찰에 따른 요소들이 존재할 수 있다. 그러한 요소들로는 다음과 같은 것들이 있다.
     ▷ 공간적 사실성(화면상의 잡음이나 왜곡의 포함 정도) 및 시간적 사실성(움직임이 자연스럽고 부드러운가)
     ▷ 평가자의 주위 환경이나 마음 상태
     ▷ 시각적 주의력 : 평가자는 화면 전체를 동시에 관찰하기 보다는 시각을 끄는 일부분을 응시 한다.
     ▷ 최신 효과 : 최근에 본 장면의 영향을 받는다.
□ DSCQS(Double Stimulus Continuous Quality Scale) 테스트
     ▷ ITU-R Recommendation BT.500-11에 정의된 주관적 화질 측정 방법
     ▷ 평가자에게 기준 원본 비디오와 평가대상 비디오 쌍을 순차적으로 보여줌으로써 화질에 대한 점수를 ‘매우 좋음(Excellent)’에서 ‘나쁨(Bad)’까지의 5단계로 평가하게 한다.
     ▷ 어느 것이 원본인지 구분할 수 없도록 무작위 순서로 원본과 평가대상 비디오를 보여준다.


□ 주관적 평가의 문제점
     ▷ 평가자나 테스트 영상에 따라 현격한 결과의 차이를 보인다.
          → 여러 가지 동영상과 여러 명의 평가자를 대상으로 반복 테스트를 수행하여 보완한다.
     ▷ 선입견이 개입된 평가 : 전문가의 경우 왜곡이나 열화 현상에 주의하게 될 수 있다.
          → 많은 수의 비전문 평가자가 필요하여 많은 비용과 시간이 소비된다.

4.2 객관적 화질 측정
□ PSNR(Peak Signal to Noise Ratio)을 화질 평가를 위한 방법으로 가장 널리 사용한다.

여기에서 n은 이미지 샘플의 비트 수이고 MSE는 원본 이미지와 테스트 이미지 사이의 평균 제곱 오차(mean square error)

□ PSNR은 쉽고 빠르게 계산할 수 있는 매우 대중적인 화질 측정 방법이다.
□ PSNR의 문제점
     ▷ PSNR이 주관적 판단과 직접적으로 연관되지 않는다.


정리하기

 

1. 요약정리
□ 사람 눈의 망막 중심부에는 밝은 빛에서 반응하는 원추세포가 있어, 삼원색으로 간주되고 있는 색 성분을 감지하며, 이에 의해 빛의 색을 감지하는 것으로 알려져 있다. (삼원자극이론)

 

□ 동시 대비효과, 마하밴드 효과, 공간주파수 응답 특성, 임계융합 주파수 등의 시각 시스템 특성으로 인하여 눈에서 감지되는 영상은 실제 장면의 신호와 다르게 받아들여질 수 있다.

 

□ 실세계의 장면을 디지털 영상으로 변환하려면 표본화와 양자화 과정을 거쳐야 한다.
     ▷ 표본화 : 시간적, 공간적으로 연속인 아날로그 신호를 일정 간격으로 구분된 일련의 표본들의 값으로 변환하는 과정이다. 원래의 신호를 복원하려면 표본화율이 나이키스트 표본화율보다 높아야 하며, 그렇지 않을 경우 에일리어싱이라고 하는 왜곡 현상이 나타난다.
     ▷ 양자화 : 표현할 수 있는 일정 개수의 값들을 정하고, 표본화된 신호의 값을 그 값들 중 하나로 근사화 하여 표현하는 것으로 양자화 오차가 발생하게 된다.

 

□ 디지털 영상은 가로와 세로로 정해진 개수의 표본점들의 집합으로 구성된다. 하나 하나의 점들을 화소(픽셀)라고 부른다.

 

□ 비디오 영상의 한 장의 완전한 화면을 프레임이라고 하며, 단위 시간에 몇 장의 프레임이 포함되어 있는가를 프레임률이라고 한다.

 

□ 순차주사 방식에서는 한 번에 한 프레임의 영상을 구성하는 형태이며, 비월주사 방식은 홀수번째 주사선들로 구성된 홀수필드와 짝수번째 주사선들로 구성된 짝수필드가 번갈아 나오는 방식이다.

 

□ 영상부호화에서 주로 사용되는 색 표현방식은 YCbCr 방식으로 휘도를 Y 값으로 표현하고, 색도를 Cb와 Cr로 표현한다.

 

□ 사람의 시각은 휘도에 비해 색도 신호에 덜 민감하므로, Cb와 Cr 성분을 낮은 해상도로 표현하여 영상을 표현하는데 필요한 비트 수를 줄일 수 있다.

 

□ 색도신호 표본화 형식은 4:4:4, 4:2:2, 4:2:0 등이 있으며, 후자로 갈수록 색도신호의 표본 수가 적다.

 

□ CIF는 다양한 TV 방식을 사용하는 그룹들 사이에서 통신을 위해 규정된 것으로 353×288의 해상도를 갖는다.

 

□ 부호화 성능을 평가하기 위한 화질 측정 방식으로는 주관적 측정 방법인 DSCQS, 객관적 측정 방법인 PSNR 등이 사용된다.


2. 참고자료
□ http://web.mit.edu/persci/people/adelson/illusions_demos.html
▷ 시각 시스템의 특성에 의한 여러 가지 착시 현상의 소개

 

□ Adelson, E.H. "Lightness Perception and Lightness Illusions," The New Cognitive
Neurosciences, 2nd ed., MIT Press, pp.339-351, 2000.
▷ 상기 사이트와 관련된 논문

'정보과학 > 영상통신시스템' 카테고리의 다른 글

MPEG 개요  (0) 2023.09.25
영상 부호화를 위한 표준  (0) 2023.09.20
영상 압축 (3)  (0) 2023.09.19
영상 압축 (2)  (0) 2023.09.18
영상 압축 (1)  (0) 2023.09.16