Информация по контейнерам (avi, mkv, mp4, ts)

Topic locked
 
Author Message

Серый1779 ®

Gender: Male

Longevity: 1 year

Posts: 733

Location: Украина

Post 02-Mar-2019 23:10

[Quote]

Информация по контейнерам (avi, mkv, mp4, ts).- 

ЧИТАТЬ В ПЕРВУЮ ОЧЕРЕДЬ!

Для монтажа есть некоторые ограничения:
1. Резать без пересжатия можно только начиная с ключевого кадра. Соответственно вырезать кусок точно так как хочется не получится, если начало фрагмента не является ключевым кадром. Заканчиваться фрагмент может либо ключевым кадром, либо P-кадром (который не использует информацию из последующего кадра в отличие от B-кадров).
2. Определять границы для форматов MKV, MP4 и TS придется либо на ощупь, либо через создание простенького avs-скрипта, чтобы можно было его открыть в редакторе VirtualDub и спокойно определить границы вырезаемых фрагментов визуально. Создание скрипта описано ниже в разделе "Получение информации о типе каждого кадра сжатого видеопотока".
3. Звук в формате AC3 резать в произвольном месте так же нельзя. Он состоит из фрагментов по 32мс. Соответственно, если длина куска видео не кратна 32мс, то аудиопоток будет заканчиваться чуть раньше. При добавлении к такому фрагменту следующего фрагмента можно получить рассинхрон, т.к. аудиодорожка от второго фрагмента пойдет следом за аудиодорожкой из первого, без учета разницы в продолжительности потоков первого фрагмента. Т.е. маленький зазор, который должен быть, просто исчезнет. Решить эту проблему можно путем распаковки звука всех фрагментов, соединения их в любом аудиоредакторе с добавлением зазоров и последующим сжатием в нужный формат уже цельной дорожки, которую и прикрепляем к склеенным видеофрагментам.

Иллюстрация


Поэтому надо учитывать это при условии, что длина кадра для PAL равна 40мс, для NTSC - 1001/24мс.
4. Все эти форматы не созданы для редактирования, это как правило форматы конечного этапа хранения. Поэтому грамотное редактирование доступно лишь через полное или частичное пересжатие. С желанием вырезать один кадр вообще выхода кроме как пересжимать не остается.
5. Черные полосы можно убрать только при полном пересжатии видео. Исключение составляет формат mkv, в котором есть параметры позволяющие указывать границы отображаемой области. Но поддержка этих опций плеерами практически отсутствует.

Структура сжатого видеопотока (теория)

Как устроена видеопоследовательность
При сжатии видео используется 3 типа кадров: I, P и B.
I-кадр - это кадр, который не зависит от других кадров и сжат с очень небольшим коэффициентом. Его так же называют ключевым кадром. При просмотре сжатого видео вся навигация осуществляется через ключевые кадры. В результате приходится распаковать лишь кусок от ближайшего ключевого кадра чтобы попасть в нужное место видео.
После I-кадров следует последовательность P-кадров, которые имеют гораздо большую степень сжатия, т.к. сохраняют лишь отличия от предыдущего кадра. Последовательность видео в этом случае может выглядеть так: IPPPPPPPPPPPPPPPPIPPPPPPP...
Для дальнейшего увеличения сжатия были введены B-кадры. Они ставятся между двумя менее сжатыми кадрами (I/P или P/P). Последовательность получается такой: IPBPBPBPBPBPBPIPBPBPBP… (или IBPBPBPBPBPBPBPIPBPBPBP…).
Коэффициент сжатия B-кадров больше, чем коэффициент сжатия P-кадров, т.к. сохраняются лишь отличия от соседних кадров. Но вместе с этим накладывается определённые ограничения. Например, вырезаемый фрагмент видео не может заканчиваться B-кадром.

Иллюстрация


В случае, если фрагмент видео заканчивается B-кадром и нельзя отступить в сторону чтобы попасть на P- или I-кадр, то придется пересжимать часть фрагмента начиная с последнего I-кадра и до конца (т.е. нужного кадра).

Контейнеры (теория)

Контейнер AVI

Описание

Компания Microsoft впервые выпустила пакет Video for Windows для операционной системы Windows 3.1 в ноябре 1992 года, и с тех пор формат AVI (Audio Video Interleave) является основным для хранения видео в операционных системах семейства Windows.
Основное преимущество универсального формата AVI (и, кстати, «секрет» его долголетия), в отличие от потоковых форматов типа MPEG, а тем более от таких специализированных разновидностей, как MP3 (MPEG Audio Layer 3), в том, что «стандартных» AVI-файлов практически не существует: AVI — фактически не более чем «контейнер», который содержит общее описание содержимого в стандартизованном виде.
Таким образом, AVI-файлы только внешне выглядят одинаково, но внутри они могут сильно различаться, и, в то время как MPEG-, MP3- и MJPEG-файлы содержат потоки только определенного вида сжатия (компрессии), AVI может содержать много различных видов компрессии в любых сочетаниях. Однако работать с AVI-файлом можно будет только пока необходимый кодек доступен для кодирования/декодирования.
Серьезным недостатком AVI-формата является то, что аудио- и видеофрагменты не содержат никаких меток времени или индексов кадра. Данные упорядочиваются по времени последовательно, в порядке поступления. Приложение для захвата или проигрывания видео должно само позаботиться о синхронизации видео- и аудиопотоков. Но если деление видео на кадры совершенно естественно, то звук представляет собой непрерывный поток, который приходится искусственно расчленять на фрагменты, соответствующие кадрам (из-за этого точная синхронизация изображения и звука часто отсутствует и звук может 'расходиться' с изображением). В простейшем случае каждому кадру видео соответствует кусок звукового сопровождения, но далеко не все AVI-файлы делаются по этой простой схеме.
Недостаток временных меток был устранен в расширении AVI-формата - OpenDML AVI (поддержанный затем в DirectShow и в ActiveMovie), которое добавляет новые куски по меткам времени.
Контейнер уже давно устарел и все никак не хочет уходить на пенсию, причем подавляющая часть медиа контента в сети до сих пор распространяется именно в нем. Минусы:
  • Для каждой цепочки AVI-файла теряется 24 байта на заголовки и индекс. Это приводит к потерям чуть более 5МБ/час.
  • Может быть сохранено только содержимое с фиксированной частотой кадров. Т.е. не возможно поместить в AVI смешанный материал, например, смесь NTSC видео и киноматериала. В действительности, есть хаки, позволяющие сохранять содержимое с переменным fps в AVI, но они увеличивают (и без того большую) избыточность впятеро или более того и поэтому непрактичны.
  • Аудио в AVI-файлах должно быть или с постоянным битпотоком (CBR) или с постоянным размером кадра (т.е. все кадры декодируются в одно и то же число выборок).
  • AVI не способен отличить P-кадр от B-кадра. Не предусмотрено спецификацией. DivX / Xvid решают эту проблему в обход спецификации, что тоже не совсем хорошо и может создавать проблемы.
  • Контейнер AVI создавался для работы через интерфейс VfW (Video for Windows) и как раз VirtualDub является программой, использующей исключительно VfW. Поскольку VfW является сильно устаревшим и не гибким, современные программы используют DS (DirectShow). Программы использующие DS замечательно работают с контейнерами под DS заточенными, но вот с VfW возникают проблемы в виде расхождения аудио и видеодорожек. Поэтому не следует использовать для работы с AVI-файлами программы, работающие не через VfW.
  • Отсутствует поддержка современных кодеков.

Структура

В соответствии с общей структурой RIFF-типа, AVI-файл должен иметь следующий вид:
RIFF 'AVI '     // четырехбуквенный идентификатор файла (в RIFF-формате)
LIST 'hdrl'     // список заголовков блоков, определяющих форматы потоков
LIST 'movi'     // блоки данных (потоков) AVI-файла
     'idx1'     // необязательный блок, определяющий размещение блоков данных внутри AVI-файла <AVI Index>
То есть в AVI-файле должно быть по крайней мере два обязательных блока: заголовка и данных, которые, в свою очередь, могут содержать подблоки. Первый блок будет содержать общую информацию о видеоролике: разрешение кадров и их частоту, формат аудио и т.д. Сначала в заголовке для записи длины потока отводилось 32 байт, поскольку в файловой системе FAT 16 максимальный раздел диска не мог превышать 2 Гбайт, поэтому и максимальный кусок видео, который можно было записывать в AVI-файле, не мог превышать 2 Гбайт (с учетом знака переменной размера). Во времена возникновения формата казалось естественным, что длина файла не может превышать размер логического диска. С появлением файловых систем FAT 32 и NTFS верхняя граница размера раздела значительно отодвинулась, однако потребовалось еще немало времени, чтобы ввести расширение формата и дождаться программ, способных это ограничение обходить.
Список 'hdrl' может состоять из подсписков:
LIST 'hdrl'     // список заголовков блоков, определяющих форматы потоков
     'avih'     // главный заголовок AVI-файла
LIST 'strl'
     'strh'     // заголовок потока
     'strf'     // формат потока
     'strd'     // дополнительный заголовок данных

Список 'movi', в свою очередь, состоит из подблоков:
LIST 'movi'                                          // блоки данных (потоков) AVI-файла
SubChunk | LIST 'rec '                               // подблок | список записей
                '##wb' (размер блока 4 байта) (data) // звуковые данные (блок)
                '##dc' (размер блока 4 байта) (data) // видеоданные (блок)
                '##db' (размер блока 4 байта) (data) // видеоданные (блок)
Таким образом, подблок данных организован в виде последовательности записей, каждая из которых состоит из одного кадра видео и соответствующего звукового сопровождения. Первоначально ##dc-блок был предназначен для хранения сжатого изображения, а ##db-блок - для несжатого DIB (Device Independent Bitmap). Но фактически они оба могут содержать сжатые данные.

Контейнер MKV

Описание

Современный, отвечающий всем потребностям, отличный контейнер.
Matroska (так по-английски пишется русское слово Матрёшка) — проект, нацеленный на создание открытого гибкого кросс-платформенного (включая аппаратные платформы) стандарта форматов мультимедийных контейнеров и набора инструментов и библиотек для работы с данными в этом формате. Этот проект является развитием проекта MCF, но значительно отличается тем, что основан на EBML (Extensible Binary Meta Language — расширяемый двоичный метаязык) — двоичном аналоге языка XML. Использование EBML позволяет расширять формат без потери совместимости со старыми программами.
Возможности формата, закладываемые в Matroska:
  • трансляция по Интернету (протоколы HTTP и RTP);
  • быстрая перемотка в файле;
  • устойчивость к ошибкам;
  • разбиение файла на главы (Chapters);
  • переключаемые на лету субтитры (с возможностью добавлять свои шрифты прямо в контейнер - без необходимости их отдельной установки в ОС);
  • переключаемые звуковые дорожки;
  • модульная расширяемость;
Следует отметить, что проект аудио/видео контейнера не включает в себя форматов сжатия видео и кодеков (таких, как MP3 или JPEG). Это упаковка, которая может содержать большое число потоков аудио, видео, субтитров и других медиа-данных (картинки, шрифты и т.д.), позволяя пользователю хранить в одном файле несколько вариантов фильма и проигрывать его мультимедиа-проигрывателем в необходимой конфигурации.
Matroska является открытым проектом (open standard). Это означает, что для персонального использования она абсолютно бесплатна, а техническая спецификация формата битового потока доступна любому, даже компаниям, желающим встроить поддержку формата в свои продукты (для этого потребуется специальная лицензия). Исходный код всех библиотек, созданных группой разработчиков проекта Matroska распространяется на условиях LGPL (библиотека для проигрывания, написанная на C с использованием целочисленной арифметики, распространятся также на условиях лицензии BSD).
Matroska является прямой открытой альтернативой контейнерам AVI, ASF video, MOV, RealMedia, MP4, MPG. Существует поддержка адаптации и реализации библиотек Matroska для OpenBeOS Mediakit и GStreamer (англ.) (мультимедийной среды ОС GNU/Linux, похожей на Microsoft DirectShow для Windows) и набора фильтров DirectShow для воспроизведения и создания файлов Matroska в ОС Windows.

Контейнер MP4

Описание

Контейнер, который является стандартом для MPEG-4.
Имеет ограничения: не может содержать внутри видео в форматах: WMV, MPEG1, MPEG2, и не может содержать внутри звук в форматах: AC3, MP2, WMA.

Контейнер TS, M2TS

Описание

Целью создания контейнера TS является мультиплексирование аудио и видео данных и синхронизация их выхода. Т.е. основное назначение - трансляция по сетям передачи данных. Для этих целей в контейнере хранится очень много служебной информации. Например, при объемах ~30Gb служебная информация будет занимать ~2Gb.
Поток транслируется пакетами по 188 байт, в которых содержится вся необходимая служебная информация (флаги, заголовки, идентификаторы, данные синхронизации и прочее). В m2ts пакет уже не 188 байт, а 192 байта. Добавляется информация о тайм-кодах для организации произвольного доступа к потоку.

Сравнение различных контейнеров (англ.)

Получение информации о типе каждого кадра сжатого видеопотока

Способ через ffmpeg

Устанавливаем последнюю версию фрейм-серера AviSynth.
Качаем последнюю версию ffmpeg. Из этого архива в папку "C:\Program Files\AviSynth 2.5\plugins\" копируем файл ffms2.dll. Если в архиве есть файл ffms2.avsi, то его копируем тоже. Файл содержит готовые полезные функции. В частности там описана используемая далее функция FFInfo. При наличии этого файла её не надо будет вставлять в скрипт.
Создаем текстовый файл с расширением *.avs и следующим содержимым:

Cкрипт (без использования файла ffms2.avsi&#41;

function FFInfo(clip c, bool "framenum", bool "frametype", bool "cfrtime", bool "vfrtime")
{
framenum = default(framenum,true)
frametype = default(frametype,true)
cfrtime = default(cfrtime,true)
vfrtime = default(vfrtime,true)
global fftempclip = c
fftempclip = frameevaluate(fftempclip, """ fftempstring = "" """)
fftempclip = framenum ? frameevaluate(fftempclip, """fftempstring = fftempstring + "Frame Number: " + string(current_frame) + " of " + string(fftempclip.framecount) + "\n" """, after_frame=true) : fftempclip
fftempclip = frametype ? frameevaluate(fftempclip, """fftempstring = fftempstring + "Picture Type: " + chr(FFPICT_TYPE) + "\n" """, after_frame=true) : fftempclip
fftempclip = cfrtime ? frameevaluate(fftempclip, """fftempstring = fftempstring + "CFR Time: " + FFFormatTime(int((current_frame * 1000) / fftempclip.framerate)) + "\n" """, after_frame=true) : fftempclip
fftempclip = vfrtime ? frameevaluate(fftempclip, """fftempstring = fftempstring + "VFR Time: " + FFFormatTime(FFVFR_TIME) + "\n" """, after_frame=true) : fftempclip
return scriptclip(fftempclip, "subtitle(fftempclip, fftempstring, lsp = 1)", after_frame=true)
}


LoadPlugin("C:\Program Files\AviSynth 2.5\plugins\ffms2.dll")
FFVideoSource("C:\Film.avi")
FFInfo(cfrtime = false, vfrtime = false)

Cкрипт (если используется файл ffms2.avsi&#41;

LoadPlugin("C:\Program Files\AviSynth 2.5\plugins\ffms2.dll")
FFVideoSource("C:\Film.avi")
FFInfo(cfrtime = false, vfrtime = false)
Открываем его в любом проигрывателе или редакторе вроде VirtualDub / VirtualDubMod или AvsP / AvsPmod.
Сначала придется подождать, это нормально. Видео индексируется.
Видим результат:

Иллюстрация



Способ через ffdshow

Устанавливаем последнюю версию фрейм-серера AviSynth.
Ставим последнюю версию ffdshow. Во время установки никакие опции трогать не надо. После установки заходим в меню "Пуск->Программы->ffdshow->Конфигурация видеодекодера". В списке слева отмечаем пункт "OSD", в открывшемся списке справа отмечаем пункт "Тип кадра" и подтверждаем изменения нажатием кнопки "OK".

Иллюстрация

Создаем текстовый файл с расширением *.avs и следующим содержимым:

Cкрипт

DirectShowSource("c:\film.avi")
Открываем его в любом проигрывателе или редакторе вроде VirtualDub / VirtualDubMod.
Видим результат:

Иллюстрация



[Profile] [PM]
Display posts:    
Topic locked

Current time is: 09-Dec 16:35

All times are UTC + 3



You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
You cannot attach files in this forum
You cannot download files in this forum