.:  
 

МАТРИЦА - "СЕРДЦЕ" ЦИФРОВОГО ФОТОАППАРАТА



Статьи на эту же тему:
-Разумно о фото
-Сравнительные размеры матриц цифровых фотоаппаратов.

Сердцем цифрового фотоаппарата можно назвать светочувствительный сенсор. Это одно из самых дорогих и сложных устройств цифровой фотокамеры.

 

Прежде чем начать рассказ об этом технологическом чуде XX века следует, наверное, пояснить, что же стоит за аббревиатурой ПЗС. В научной литературе этот термин расшифровывается как Прибор с Зарядовой Связью - своеобразный перевод английского сокращения CCD (Charge-Coupled Device). По сути, это прибор, способный воспринимать и накапливать идущие от объекта частицы света (фотоны) и преобразовывать их в электрические заряды, считывая которые можно затем при помощи компьютера восстановить изображение этого объекта.

Несмотря на то, что ПЗС был изобретен больше трёх десятков лет назад, он до сих пор остаётся золотым стандартом, эталоном, с которым сравниваются новые сенсоры. Мы подробно расскажем о том, как работают ПЗС сенсоры, и лишь немного коснемся принципов работы КМОП матриц.


ПЗС и КМОП. История возникновения и основные отличия

Сенсоры стали разрабатывать для правительственных разведывательных и космических программам США. Службам разведки, во время холодной войны, требовались совершенные методы наблюдения. В частности, были запущены секретные спутники ЦРУ и ВВС США - Corona. Эти спутники были оснащены современнейшими по тому времени камерами, использующими специальные линзы и новые типы пленок.

Чтобы определить масштаб фотографии, использовались кукурузные поля Среднего Запада США, которые были специальным образом покошены. На них выкашивали довольно большие геометрические фигуры - чтобы можно было распознать из космоса. (Теперь становится понятно, откуда возникли эти таинственные круги, десятилетиями волновавшие читателей желтой прессы.)

Как только пленка была отснята целиком, она в керамическом контейнере на парашюте катапультировалась на Землю - в районе Гавайев. Эти контейнеры подбирались ещё в воздухе самолетами C-119 ВВС США (так называемые "Летающие товарные вагоны" - Flying Boxcar). Специально для этого самолеты оснащались длинными крючками, прикрепленными к хвостовому оперению. Если пилот промахивался и не ловил контейнер, пленка попадала в Тихий Океан, где могла плавать ещё пару дней. Если в течение двух дней ВМС США не находили контейнер, под воздействием морской воды соляные пробки растворялись и контейнер вместе с содержимым погружался в океан - чтобы не нашел неприятель. Министерство обороны считало, что под водой шпионов нет. Но даже при таких мерах безопасности, по крайней мере, один такой контейнер попал во вражеские руки.

Несмотря на такие случайные инциденты, спутниковое слежение было намного безопаснее, чем шпионаж с использованием самолетов или воздушных шаров - ведь спутник не так-то легко подстрелить. Так вот, процесс возвращения пленки - самый небезопасный из всей этой цепочки операций. Понятно, что надо было придумать какой-то выход из этой ситуации, и придумать как можно скорее.

Следующим технологическим новшеством в спутниковой фотографии стали обработка пленки на борту спутника, сканирование её с помощью светового луча, преобразование световых волн в аналоговый электрический сигнал, и последующая его передача на специальную приемную станцию на Земле. Как только сигналы оказывался на Земле, они преобразовывались назад в изображения. (Аналоговая система была похожа на ту, которой пользовались в Associated Press и в United Press International для передачи новостей и фотографий по проводам).

Но до сих пор доподлинно не известно, где, когда, и как в правительственных разведывательных и космических программах на смену аналоговым системам пришла цифровая фотография. До сих пор часть информации находится под грифом "секретно". Где-то с начала 70-х вся космическая фотография постепенно начала переходить на цифру. При этом разрешение фотографий и качество улучшалось по экспоненте. Создавались действительно впечатляющие снимки вселенной. А качество цифровых фотографий, вроде тех, что получены на Земле с помощью усовершенствованной модели космического телескопа Hubble, было исключительным.

У цифровой фотографии нет точной даты рождения. Обычно считают, что цифровая фотография появилась в конце 60х, когда ученые обнаружили, что КМОП (комплементарный металло-оксидный полупроводник) может быть светочувствительным. Прибор с зарядовой связью был изобретён в конце 1969 года Вильямом Бойлем (William S.Boyle) и Джорджем Смитом (GeorgeE.Smith), работавшими в лабораториях Bell.

Так как качество изображения было очень высоким, эти приборы быстро вытеснили КМОП из цифровой обработки изображений. Однако отметим, ПЗС более чувствителен к радиоактивному излучению, нежели КМОП. А чем выше вы находитесь от поверхности Земли, тем больше излучение. Именно поэтому КМОП сенсоры не были забыты, и правительство США оплачивало исследования в этой области.

Несмотря на всё разнообразие технологий, в большинстве случаев в цифровых камерах используются либо КМОП, либо ПЗС сенсоры. Самым важным отличием между этими системами является способ перенесения электронов с сенсора (об этом мы скажем немного позже). Кроме того, КМОП может осуществлять большее количество функций прямо на чипе. Тем не менее, начало у этих технологий общее, и что самое примечательное, первоначально, ни та, ни другая технология не имели никакого отношения к цифровой фотографии. Оба устройства представляли собой полупроводниковую память.

Как было сказано выше, в 1969 году в лабораториях Bell была изобретена ЦМД-память (память на цилиндрических магнитных доменах, пузырьковая память, bubble memory). Предполагалось, что она будет энергонезависимой (то есть при выключения питания компьютера данные не теряются). Воодушевленные потенциалом этих устройств, ученые продолжили опыты с технологией ПЗС как с последовательными запоминающими устройствами. Но эта технология быстро устарела - стоило появиться более эффективной и быстрой энергонезависимой памяти, например, EEPROM (electrically erasable programmable read-only memory - электронно-перепрограммируемая постоянная память). Тем не менее, как обнаружилось, ПЗС память обладает впечатляющими возможностями по переносу заряда, что сделало ее идеальным для сенсоров. Впервые в массовое производство ПЗС сенсоры были запущены в 1973 году. КМОП технология продолжала использоваться в памяти, обрабатывающих и других цифровых устройствах, что связано с ее низким энергопотреблением и большей функциональностью.

ПЗС являются специализированными чипами и используются только для получения изображения. Производят эти чипы всего несколько фирм. В отличие от ПЗС, область применения КМОП устройств намного шире. Они используются как в процессорах персональных компьютеров, так и в подавляющем большинстве потребительской электроники. Так как в основном КМОП устройства изготавливаются большими партиями и по стандартному технологическому процессу, их производство обходится значительно дешевле.

Кроме дешевизны производства, КМОП устройства обладают некоторыми преимуществами. Так как архитектура КМОП позволяет производить обработку изображений и аналого-цифровые преобразования (АЦП - ADC) непосредственно на чипе, цифровые камеры и другие устройства, использующие КМОП технологию вместо ПЗС, в итоге оказываются значительно дешевле.

Тем не менее, в системах, где самым важным считается качество, всё же используются ПЗС, так как они чувствительнее к свету, имеют большую степень градаций, и минимум шумов.

Структура ПЗС

Пиксель

Наиболее важной составляющей ПЗС является приемник света - двумерная матрица, состоящая из очень маленьких кремниевых детекторов света прямоугольной формы, называемых пикселями. Каждый пиксель работает как копилка для электронов, возникающих в нем под действием фотонов, пришедших от источника света. Во время экспозиции, время которой регулируется при помощи затвора, каждый пиксель постепенно заполняется электронами пропорционально количеству попавшего на него света.

По окончании съемки столбцы с накопленными в пикселях электронами начинают сдвигаться к краю матрицы, где находится аналогичный измерительный столбец. В нем заряды сдвигаются уже в перпендикулярном направлении и попадают на измерительный элемент, создавая в нем микротоки, пропорциональные этим зарядам. Таким образом, для каждого последующего момента времени мы можем получить значение накопленного заряда и определить, какому пикселю на матрице (номер строки и номер столбца) он соответствует.

Вся эта непростая технология может быть наглядно проиллюстрирована с помощью элегантной аналогии, предложенной Джеромом Кристианом (Институт Карнеги в Вашингтоне). Достаточно представить себе цепочку людей, передающих друг другу по очереди ведра с краской (количество людей в цепочке определяет разрешение по вертикали), а затем вообразить, что таких цепочек несколько, и расположены они бок-о-бок (число цепочек задает горизонтальное разрешение). В конце пути ведра ставятся на ленту транспортера (регистр сдвига) и по очереди перемещаются в хранилище (выходной усилитель и аналогово-цифровой преобразователь, АЦП).

Вот, в общих чертах, процесс формирования снимка ПЗС-матрицей.

В КМОП-матрице заряд пикселя преобразуется в напряжение прямо в пикселе, после чего может быть считан. Следуя нашим аналогиям - к каждому владельцу ведерка подведен отдельный трубопровод, куда и сливается содержимое тары.

Микролинзы

В обычной фотопленке на пластиковую основу наносятся галоиды серебра - именно они реагируют на любой свет, падающий под любым углом. В отличие них, кремниевые пиксели реагируют на свет только в том случае, когда он падает под прямым углом (или близким к прямому). Это требуется для того, чтобы пиксели получали больший электрический заряд. Для обеспечения требуемого угла над каждым пикселем сенсора помещается специальная выпуклая микролинза. Именно таким образом корректируется угол падения света и увеличивается светочувствительность сенсора.

Обычно микролинзы создаются путем нанесения резистного материала на сенсор. Затем относительно пикселей в этом материале протравливается сетка. При нагревании остатки оплавляются и принимают куполообразную форму.

Цветные фильтры

Сенсоры - это устройства, определяющие лишь градации серого (градации интенсивности света - от полностью белого до полностью черного). Каждый пиксель несет информацию о яркости: чем больше фотонов попало, тем выше яркость и наоборот.

На рисунке, каждому пикселю соответствует числовое значение, равное количеству принятых фотонов.

3 - три фотона = низкая степень яркости;
7 - семь фотонов = средняя степень яркости;
10 - десять фотонов = максимальная степень яркости пикселя, на данном рисунке.

Чтобы камера могла различать цвета, на кремний накладывается массив цветных фильтров, которые помещаются между микролинзами и пикселями.

Для того чтобы каждому пикселю соответствовал свой основной цвет, над ним помещается фильтр соответствующего цвета. Фотоны, прежде чем попасть на пиксель, сначала проходят через фильтр, который пропускает только волны своего цвета. Волны другой длины (другого цвета) будет просто поглощаться фильтром.

Как мы уже знаем, любой цвет в спектре можно получить смешением всего нескольких основных цветов. В модели RGB таких цвета три.

Для каждого применения разрабатываются свои массивы цветных фильтров. Но в большинстве сенсоров цифровых камер наиболее популярными являются массивы фильтров цветовой модели Байера (Bayer pattern). Эта технология была изобретена в 70-х годах, когда проводились исследования в области пространственного разделения. В этой системе фильтры расположены вперемежку, в шахматном порядке, а количество зеленых фильтров в два раза больше, чем красных или синих. Порядок расположения таков, что красные и синие фильтры расположены между зелеными.

Такое количественное соотношение объясняется строением человеческого глаза - он более чувствителен к зеленому свету. А шахматный порядок обеспечивает одинаковые по цвету изображения независимо от того, как вы держите камеру (вертикально или горизонтально). При чтении информации с такого сенсора, цвета записываются последовательно в строчках. Первая строчка должна быть RGRGRG, следующая - GBGBGB (где R - red, G - green, B - blue) и т.д. Такая технология называется последовательной RGB (sequential RGB или sRGB).

В ПЗС камерах совмещение всех трех сигналов воедино происходит не на сенсоре, а в устройстве формирования изображения (процессоре), уже после того, как сигнал преобразован из аналогового вида в цифровой. Первичные цвета каждого фильтра математически интерполируются с учетом цветов соседних фильтров.

Например, чтобы определить, влияние соседних пикселей на цвет центрального при линейной интерполяции будет обрабатываться матрица пикселей размером 3х3. Возьмем, к примеру, простейший случай - три пикселя - с синим, красным и синим фильтрами, расположены в одной строчке (BRB). Предположим, вы пытаетесь получить результирующее значение цвета красного пикселя. Если все цвета равноправны, то цвет центрального пикселя вычисляется математически как две части синего к одной части красного. На самом же деле, алгоритмы даже простой линейной интерполяции намного более сложны, они учитывают значения всех окружающих пикселей. Если интерполяция происходит плохо, то получаются зубцы на границах смены цветов (или появляются цветовые артефакты).

Типы ПЗС

Interline Transfer CCD или чересстрочные ПЗС (видео ПЗС)

В чересстрочных ПЗС каждый пиксель обладает как фотоприемником, так и областью для накапливания заряда. Эта область возникает в результате загораживании части пикселя от света. Её используют только для переноса электронов.

Такие затененные области образуют вертикальный канал для передачи заряда, при этом заряд поступает сверху вниз к горизонтальному каналу передачи. Область, на которую падает свет, называется апертурой (aperture) или просто фоточувствительной частью пикселя.

Чересстрочная развертка позволяет электрическому заряду пикселя быстро перемещаться на соседствующую затененную область, по которой он строчка за строчкой двигался бы к горизонтальному сдвиговому регистру. Такое быстрое перемещение заряда из светочувствительной области позволяет ей быстрее принимать следующую порцию фотонов.

В цифровых камерах такая быстрая готовность апертуры пикселя принимать следующую порцию данных изображения позволяет получать видеоизображение. Минусом в такой технологии, безусловно, можно считать значительное уменьшение светочувствительной области. Для обеспечения более высокого разрешения, в ПЗС функционируют микролинзы, позволяющие лучшим образом направлять фотоны в светочувствительные области. Обычно, чересстрочные сенсоры используются в потребительских цифровых камерах.

Full-Frame CCD или полнокадровые ПЗС

В полнокадровых ПЗС весь пиксель выполняет светоприемную функцию, а каналы передачи заряда, спрятаны под пиксель.

Благодаря такому строению, полноформатные ПЗС имеют больший динамический диапазон и соотношение сигнал/шум.

В Full-Frame CCD, во время передачи заряда пиксель не должен принимать фотоны. Чтобы обеспечить этот процесс и предотвратить попадание фотонов на пиксель (чтобы изображение не было размазано), за объективом камеры находится механический затвор. Полноформатные ПЗС используются в более дорогих фотокамерах, более высокого класса, например цифровая профессиональная фотокамера Olympus E-1.




Frame Transfer CCD или ПЗС с покадровым переносом заряда

ПЗС этого типа очень похожи на полноформатные ПЗС, отличие заключается в том, что они отводят половину матрицы для временного хранения электрического заряда. Такая затененная область называется ещё "матрицей хранения" ("Storage array"). Как только заканчивается период интеграции и в светочувствительных областях накапливается заряд, он быстро перемещается в матрицу хранения.

Такие матрицы могут работать без задержки на использование механического затвора, что обеспечивает им очень высокую скорость захвата изображения. Но заряд не полностью успевает переместиться в матрицу хранения до наступления следующего периода интеграции. Вследствие такой нахлестки изображение получается размытым. Еще одни минусом таких ПЗС является значительно больший размер (а, значит, и более высокая цена), так как на кристалле необходимо кроме светочувствительных элементов располагать и матрицу хранения.

Альтернативные сенсоры

Super CCD

Технология Super CCD, разработана Fujifilm в 1999 году и представлена в 2000 г. Вместо горизонтального размещения прямоугольных диодов компания разместила их под углом 45° таким образом, что поверхность стала похожа на соты. Воспринимаемые ими световые сигналы делятся на горизонтальные и вертикальные составляющие, а затем комбинируются, что по заявлению разработчиков, позволяет достичь большего разрешения по обеим осям. Кроме того, сотовое расположение светодиодов позволяет разместить их в большем количестве на той же площади.




Foveon X3

В основе технологии, представленной компанией Foveon под названием X3, лежит физическое явление, заключающееся в том, что с увеличением длины волны световых волн растет и глубина их проникновения в кремний. Фотодиоды, созданные чередованием зон проводимости первого и второго типа, размещают один под другим на характерных глубинах для улавливания фотонов голубого, зеленого и красного цвета.

Таким образом, получается датчик, регистрирующий информацию о всех трех цветовых компонентах изображения в одной точке, точно соответствующей координатам формируемого пикселя.

Некоторые важные характеристики ПЗС

Разрешение (Array Format)

Этот параметр характеризует разрешающую способность матрицы. Чем больше разрешение матрицы, тем более детализированный снимок можно получить.

Таблица 1: Размеры отпечатков в зависимости от разрешения снимков

Разрешение снимков по умолчанию (72 dpi) Отпечаток (ширина и высота при 150 dpi) Отпечаток (ширина и высота при 300 dpi)
640 x 480 пикселей 10.84 x 8.13 см 5.42 x 4.06 см
1,024 x 768 пикселей 17.34 x 13.00 см 8.67 x 6.50 см
1,280 x 960 пикселей 21.67 x 16.26 см 10.84 x 8.13 см
1,600 x 1,200 пикселей 27.09 x 20.32 см 13.55 x 10.16 см
2,048 x 1,536 пикселей 34.68 x 26.01 см 17.34 x 13.00 см
2,288 x 1,712 пикселей 38.74 x 28.99 см 19.37 x 14.49 см
2,560 x 1,696 пикселей 43.35 x 28.72 см 21.67 x 14.36 см
2,560 x 1,920 пикселей 43.35 x 32.51 см 21.67 x 16.26 см
2,816 x 2,112 пикселей 47.68 x 35.76 см 23.84 x 17.88 см
3,200 x 2,400 пикселей 54.19 x 40.64 см 27.09 x 20.32 см


Таблица 2: Разрешение в пикселях для некоторых форматов бумаги

Формат бумаги Необходимое разрешение(при 150 dpi) Необходимое разрешение(при 300 dpi)
13 x 9 см 768 x 531 пикселей 1,535 x 1,062 пикселей
15 x 10 см 886 x 591 пикселей 1,772 x 1,182 пикселей
18 x 13 см 1,063 x 768 пикселей 2,126 x 1,535 пикселей


Динамический диапазон (Dynamic Range)

Динамический диапазон - это способность матрицы отличать самые темные оттенки от самых светлых. Чтобы обеспечить широкий динамический диапазон, каждый пиксель должен уметь "удержать" минимальное количество электронов в условиях слабой освещенности и вместить большой заряд при попадании на сенсор мощного потока света.

К примеру, кадр может включать в себя как ярко освещенные участки, так и глубокие тени, поэтому сенсор должен отобразить все оттенки от максимально яркого до максимально темного.

АНАЛОГО-ЦИФРОВОЙ ПРЕОБРАЗОВАТЕЛЬ

АЦП - устройство, преобразующее аналоговый сигнал в цифровую последовательность для последующей обработки встроенным микрокомпьютером камеры. Основной характеристикой АЦП является его разрядность - количество дискретных уровней сигнала, кодируемых АЦП. В АЦП современного цифрового фотоаппарата используется двоичная система исчисления.

Привычной для нас системой исчисления является десятичная система, т.е. та в которой любое число представляет собой комбинацию десяти цифр 0123456789. Любое число можно представить в двоичной системе исчисления в виде единиц и нулей. Двоичная система исчисления представляет собой произведение коэффициента (единицы либо нуля) на двойку в степени от нуля до n-1, где n - разрядность АЦП.

Например, число 39 в двоичной системе исчисления:

Происходит сложение значений активных ячеек, т.е. тех, в которых стоит единица. Таким образом: 39=32+4+2+1.

Итак, число 39 для восьмибитного АЦП, в двоичной системе исчисления будет иметь вид: 00100111

Двоичная система Десятичная система
00000000 0
00000001 1
00000010 2
00000011 3
00000100 4
00000101 5
00000110 6
..... .....
11111111 255


Одна логическая единица или один логический ноль составляют один бит информации.

В большинстве современных камерах OLYMPUS, как правило, используется восьмибитный аналого-цифровой преобразователь, т.е. оцифровка аналогового сигнала с матрицы происходит по 256 уровням для каждого из трех каналов цвета (RGB), где 00000000 (0) - минимальная яркость, 11111111 (255) - максимальная. Глубина цвета при этом составляет 24 бита (по 8 бит на каждый из трех каналов RGB).

Таким образом, для того чтобы вычислить все возможные комбинации уровней яркости в каналах RGB, и, соответственно, количество цветовых оттенков, воспроизводимых камерой с восьмибитным АЦП необходимо перемножить 256х256х256=16 777 216.

В некоторых камерах, таких как OLYMPUS Е-20Р, в режиме TIFF и JPEG - 8 бит на канал, в режиме RAW - 10 бит на канал, в OLYMPUS Е-1: TIFF и JPEG - 8 бит на канал, RAW - 12 бит на канал.

Процессор

АЦП передает оцифрованные данные на цифровой процессор сигналов (DSP - digital signal processor). В DSP данные преобразуются в изображение на основе внесенных производителем алгоритмов (программного обеспечения). Эти алгоритмы включают в себя определение координат полученных от сенсора точек и присвоение им цвета с учетом расположения пикселей со светофильтрами трех основных цветов (RGB), из этих цветов формируются все из 16 777 216 воспроизводимых оттенков. DSP при помощи встроенного программного обеспечения анализирует цифровое значение уровней сигнала в трех каналах основных цветов расположенных по соседству пикселей с разными светофильтрами и присваивает им цвет в соответствии с результатами. Таким образом, формируется цветное изображение. DSP также осуществляет регулировку яркости, контрастности, насыщенности, резкости изображения, убирает шумы, при этом учитываются особенности человеческого зрения. В некоторых моделях, таких как OLYMPUS Е-1 применяется несколько процессоров, каждый из которых выполняет отдельные задачи.

Как только изображение пройдет через DSP, процессор камеры будет преобразовывать поток данных в файл изображения в формате JPEG, TIFF или RAW. К этому файлу прикрепляются и метаданные фотографии (значение диафрагмы, выдержки, баланс белого, коррекция экспозиции, режим съемки и работы вспышки, чувствительность, фокусное расстояние, разрешение, модель камеры, версия программного обеспечения камеры, время, дата и т.д.) Если файл не записывается в форматы RAW или TIFF, то он сжимается в соответствии с выбранным пользователем коэффициентом сжатия и алгоритмами работы программного обеспечения камеры. Алгоритмы сжатия в фотоаппарате "стараются" соблюсти баланс между размером файла, скоростью обработки и качеством изображения. После этого изображение записывается либо на встроенную память, либо на съемную карту памяти.

ФОРМАТЫ ЗАПИСИ ФОТОГРАФИЙ

Одним из главных отличий цифрового фотоаппарата от фотоаппарата снимающего на пленку есть совершенно другой принцип хранения изображения. Благодаря тому, что результаты съемки преобразуются в цифровой код, стали возможны все те функциональные преимущества цифровой технологии над, так называемой, пленочной - высокая надежность хранения снимков, максимально простое копирование и передача, огромные возможности обработки и вывода, просмотр сразу после съемки, удаление и т. д.

В свою очередь, самый популярный вопрос, задаваемый хотя бы раз каждым: "Сколько кадров можно сделать этим фотоаппаратом?" в отношении к цифровой фотокамере становится практически философским. Если с фотоаппаратом, снимающим на пленку, все предельно просто - количество кадров зависит от длины рулона, то в цифровой фотокамере все гораздо запутанней. Но это на первый взгляд.

Благодаря тому, что цифровой снимок это не просто проекция на чувствительную к свету пленку, а набор электронных сигналов, преобразованных в цифровой код, появляется возможность перед сохранением этот код модифицировать, преследуя этим разные цели и расширяя, таким образом, функциональность фотокамеры. Другими словами, информацию об отснятом изображении можно сохранять по-разному, выбирая, тем самым, между качеством и объемом занимаемого места в памяти (что непосредственно влияет на количество одновременно сохраняемых снимков). Отсюда следует одно из преимуществ цифрового фотоаппарата - возможность в любой момент изменить уровень качества/количества получаемых фотографий, что в "пленочном" достигается только путем замены пленки.

Под качеством снимка цифровой камеры следует понимать комбинацию как минимум двух параметров - разрешения, с которым снимок сохранен в памяти и коэффициента сжатия, которому подвергается цифровой код перед записью. С разрешением все достаточно просто - это количество точек, описание которых хранится в памяти, и из которых изображение восстанавливается для вывода на экран или печати. Соответственно, чем больше это количество, тем более детально сохранится изображение, и больший отпечаток удастся распечатать.

Сложнее неподготовленному человеку разобраться в процессе сжатия снимка (точнее файла содержащего информацию о снимке).

Рассмотрим на простом примере работу алгоритма сжатия изображений. Допустим, есть условный рисунок, на котором изображены участок песчаного пляжа, полоса синего моря, голубое небо и солнце.

Необходимо "оцифровать" его с разрешением условной матрицы 48 точек (6х8точек).

В упрощенном виде задача сводится к описыванию оттенка изображения в каждой точке матрицы:

a1 - голубой;
b1 - голубой;
………………
a2 - голубой;
b2 - желтый;
c2 - голубой;
………………
a4 - синий;
………………
a5 - желтый;
………………
h6 - желтый.

Таким образом, используя 48 строк можно описать данный рисунок с разрешением 48 точек и, каждый, знакомый с этим алгоритмом, сможет восстановить рисунок не видя исходного.

Для заполнения пробелов между ячейками матрицы в данном случае можно воспользоваться воображением и логикой - в цифровом фотоаппарате эту задачу выполняет на этапе оптимизации изображения встроенный микрокомпьютер с соответствующим программным обеспечением.

Однако не трудно заметить, что в полученном описании много строк, содержащих идентичную информацию, с разницей лишь в координатах. С учетом этого можно данный код оптимизировать:

a1-a2, c2-h3 - голубой;
b2, a5-h6 - желтый;
a4-h4 - синий.

В итоге, ту же информацию удалось записать всего в трех строках вместо 48. Это наглядный пример так называемого сжатия без потери данных - когда при оптимизации кода не теряется полезная информация о снимке. В данном случае такой экономии удалось достичь благодаря тому, что рисунок очень простой и не изобилует оттенками (их, фактически, всего три). Реальная же фотография состоит из миллионов точек и миллионов оттенков, и существенно сжать такой массив данных без потери информации не удастся. Поэтому под сжатием графических файлов подразумевают именно сжатие с потерями - когда часть информации отбрасывается (например, близкие по цвету оттенки принимаются за одно среднее значение). Логично предположить, что при этом произойдет ухудшение качества и результат не будет соответствовать исходному изображению. Однако подобные алгоритмы весьма сложны и действуют таким образом, что визуально разницу заметить очень непросто (например, зрение человека способно различить не более 2 млн. цветов, тогда как цифровой снимок производится, как правило, с глубиной цвета в 16 млн.). При этом алгоритмы позволяют сжимать данные с разной степенью сжатия, предоставляя выбор между качеством и количеством снимков.

Алгоритм JPEG

Стандартом де-факто в современном мире цифровых изображений является алгоритм сжатия JPEG (от Joint Photographic Expert Group - Объединенная группа экспертов в области фотографии, подразделение ISO - Международной организации по стандартизации). Разработан алгоритм в 1990 году и на сегодня, практически невозможно найти цифровой фотоаппарат, не поддерживающий этот стандарт.

Процесс сжатия по схеме JPEG состоит из нескольких шагов. На первом шаге производится преобразование изображения из цветового пространства RGB в пространство YUV, основанное на характеристиках яркости и цветности. Вся дальнейшая работа производится именно с этим цветовым пространством, которое благодаря некоторым своим характеристикам позволяет получать столь большие степени сжатия.

Что же такого необычного в YUV представлении цвета по сравнению с RGB? А то, что оно наиболее близко к "естественному", тому, которое неосознанно выполняет человек. Y-компонента, или яркость, тесно связана с качеством картинки. Точнее сказать Y - это и есть картинка, только черно-белая. Компоненты U и V содержат информацию о цвете и позволяют раскрашивать Y-картинку.

На следующем после преобразования шаге изображение разделяется на квадратные участки размером 8х8 пикселей. После этого над каждым участком производится т.н. дискретное косинус-преобразование (ДКП). При этом выполняется анализ каждого блока, разложение его на составляющие цвета и подсчет частоты появления каждого цвета.

Человеческий глаз устроен таким образом, что наиболее чувствителен именно к яркостной составляющей изображения (Y-компонента) и наименее к цветовым. Причина этого феномена лежит в физиологии. Стоит вспомнить, что зрачок, представляет собой оптическую линзу, которая фокусирует изображение на глазное дно, покрытое палочками и колбочками. Ну так вот, палочки - это сенсоры, воспринимающие именно яркостную составляющую, а колбочки - цветовую. Причем палочек на порядок больше, чем колбочек, и они гораздо более чувствительны к свету. Существует поговорка "Ночью все кошки серы". Почему так? Почему вечером все теряет цвет? Именно из-за того, что количества падающего на зрачок света не хватает для того, чтобы вызвать реакцию колбочки. Но и чувствительность человеческого глаза к разным цветам тоже величина не постоянная - зрачок более чувствителен к нижней части цветового спектра, нежели к верхней. Формат JPEG как раз и учитывает эти особенности.

Анализируя частотную информацию о появлении цветов, удается избавиться от части информации уже в процессе квантования. При этом цвета в верхней части спектра исключаются, что практически не сказывается на зрительном восприятии образа. Также исключается часть яркостной информации. Грубо говоря, JPEG просто отбрасывает от яркостной составляющей половину полезного сигнала, а от цветовой 3/4. Это, конечно, примерно, т.к. существуют градации и более сложные схемы сжатия.

Количество информации, исключаемой при сжатии, зависит от требуемого качества изображения. Чем выше коэффициент сжатия, тем большее количество яркостных и цветовых характеристик исключается, тем меньше получаемый файл и тем больше шансов обнаружить при просмотре визуальные искажения (артефакты) JPEG. Эти искажения проявляются в виде размытия контрастных границ, проявления блочной структуры кадра и других нежелательных явлений.

При максимально-высоких уровнях сжатия детали полностью стираются, и блок становится серым. При средних и низких уровнях сжатия в файле сохраняется примерная информация о цвете данного участка. Величина этой "примерности" напрямую зависит от степени сжатия. Нужно понять, что в отличие от обычных форматов, сохраняющих изображение "поточечно", JPEG сохраняет примерные цвета. Если говорить научным языком, то JPEG использует для сохранения ряды Фурье и при больших степенях сжатия просто отбрасывает члены ряда высшего порядка. И каждый раз при воспроизведении изображения на экране компьютер производит синтез. Причем, достаточно ресурсоемкий и заметный на медленных компьютерах. Из этого следует одно замечание - если какой-нибудь рисунок сохранен в формате JPEG, то восстановить его обратно до последнего пикселя невозможно! Именно из-за этого формат называется "форматом с потерями", и именно поэтому не рекомендуется пересжимать JPEG-изображения, т.к. они обязательно станут хуже. А если это сделать 10 раз? Информация о яркости и цвете затем кодируется так, что сохраняются только отличия между соседними блоками. В результате блоки представляются строками чисел, которые можно сжимать дальше. Поскольку в результате обработки блоки содержат много нулей, последняя стадия кодирования (выполняемая по алгоритму Хаффмана - подобного тому, что применяется в архиваторах) дает хорошие результаты. Отсюда еще небольшое замечание - сжимать JPEG-файл архиватором не имеет никакого смысла, ведь он уже сжат. Полученный архив наверняка будет больше по размеру, чем исходная фотография.

Таким образом, первоначальные 24 бита на элемент изображения или 1536 бит (192 байта) на блок превращаются в горстку бит, которые описывают зрительные характеристики всего участка изображения.

Алгоритм TIFF

Если же потери информации неприемлемы, и необходимо сохранить снимок в максимальном качестве - подойдет формат TIFF (Tagget Image File Format - разработан фирмой Aldus Corporation для хранения графических изображений высокого разрешения, полученных с помощью сканера в 1986 году). Хотя, на самом деле, этот формат позволяет, как сжимать графические файлы различными алгоритмами (в том числе и JPEG), так и сохранять несжатые изображения, в цифровой фотографии файлы в формате TIFF принято называть несжатыми (однако, наиболее точным будет определение сжатые без потери информации).

Алгоритм RAW

Также следует отметить еще один формат, используемый в цифровой фотографии - RAW (от англ. сырой). Данный формат - прерогатива профессиональных и полупрофессиональных фотоаппаратов, так как он не очень удобен пользователю-любителю вследствие того, что прежде, чем получить результат, необходимо произвести ряд манипуляций с файлом снимка на компьютере со специальным программным обеспечением. Как известно, в цифровом фотоаппарате после снимка данные с матрицы обрабатываются, оптимизируются "по усмотрению" программного обеспечения фотокамеры, формируются в графический файл и записываются в память. Это удобно с точки зрения простоты и скорости получения результата, но не всегда оптимально с точки зрения качества снимка. Безусловно, высокий уровень современных систем обработки изображения в цифровых фотоаппаратах позволяет получать прекрасные результаты, полностью полагаясь на логику камеры, что вполне подходит для большинства задач. Но при профессиональном использовании цифрового фотоаппарата возникает необходимость вмешиваться в процесс создания изображения. В RAW-файле записываются лишь уровни яркости каждого пикселя матрицы (фактически, "черно-белое" изображение) и информация о том, под фильтром какого цвета расположен каждый пиксель. Таким образом, удается сохранить полную информацию о яркости и цвете в каждом пикселе, чего достаточно для дальнейшего формирования изображения специальным программным обеспечением на компьютере. Как правило, файл в формате RAW заметно меньше файла в формате TIFF, хотя и намного больше файла JPEG даже в минимальном сжатии. Например, снимок с разрешением 5 млн. пикселей в форматах TIFF/RAW/JPEG (минимальное сжатие) соответственно будет "весить" 15,1/9,46/3,30 Мбайт (данные приведены для фотоаппарата Olympus CAMEDIA E-20 - для других фотоаппаратов значения могут отличаться). Дабы несколько повысить удобство при съемке в формате RAW, в современных камерах встречаются расширенные возможности - конвертирование в JPEG и TIFF непосредственно в фотоаппарате (Olympus CAMEDIA C-5050 Zoom) или съемка в формате RAW+JPEG (Olympus E-1), когда создается два файла в разных форматах.

Как итог, следует отметить, что в отличие от фотоаппарата снимающего на пленку, цифровой позволяет динамически изменять уровень качества и, соответственно, количества снимков. Как правило, в каждой фотокамере есть возможность выбрать разрешение, с которым будут сохраняться фотографии и уровень сжатия. В аппаратах начального класса эти критерии могут быть совмещены в общий уровень качества:

Olympus CAMEDIA C-150

  • SHQ (Super High Quality) - разрешение 1600х1200, минимальное сжатие;
  • HQ (High Quality) - разрешение 1600х1200, стандартное сжатие;
  • SQ1 (Standard Quality1) - разрешение 1024х768, максимальное сжатие;
  • SQ2 (Standard Quality2) - разрешение 640х480, максимальное сжатие.

В камерах более высокого класса можно задавать различные степени сжатия для любого уровня разрешения.

назад к оглавлению

     
    
 
 
   
       
 
    Design by Alex V. Meshkov © 2006
 
 
На главную страницу