Информация по контейнерам (avi, mkv, mp4, ts)

Тема закрыта
 
Автор Сообщение

Серый1779 ®

Пол: Мужской

Стаж: 6 лет

Сообщений: 3685

Откуда: Украина

Создавать темы 02-Мар-2019 23:10

[Цитировать]

Информация по контейнерам (avi, mkv, mp4, ts).- 

ЧИТАТЬ В ПЕРВУЮ ОЧЕРЕДЬ!

Для монтажа есть некоторые ограничения:
1. Резать без пересжатия можно только начиная с ключевого кадра. Соответственно вырезать кусок точно так как хочется не получится, если начало фрагмента не является ключевым кадром. Заканчиваться фрагмент может либо ключевым кадром, либо P-кадром (который не использует информацию из последующего кадра в отличие от B-кадров).
2. Определять границы для форматов MKV, MP4 и TS придется либо на ощупь, либо через создание простенького avs-скрипта, чтобы можно было его открыть в редакторе VirtualDub и спокойно определить границы вырезаемых фрагментов визуально. Создание скрипта описано ниже в разделе "Получение информации о типе каждого кадра сжатого видеопотока".
3. Звук в формате AC3 резать в произвольном месте так же нельзя. Он состоит из фрагментов по 32мс. Соответственно, если длина куска видео не кратна 32мс, то аудиопоток будет заканчиваться чуть раньше. При добавлении к такому фрагменту следующего фрагмента можно получить рассинхрон, т.к. аудиодорожка от второго фрагмента пойдет следом за аудиодорожкой из первого, без учета разницы в продолжительности потоков первого фрагмента. Т.е. маленький зазор, который должен быть, просто исчезнет. Решить эту проблему можно путем распаковки звука всех фрагментов, соединения их в любом аудиоредакторе с добавлением зазоров и последующим сжатием в нужный формат уже цельной дорожки, которую и прикрепляем к склеенным видеофрагментам.

Иллюстрация


Поэтому надо учитывать это при условии, что длина кадра для PAL равна 40мс, для NTSC - 1001/24мс.
4. Все эти форматы не созданы для редактирования, это как правило форматы конечного этапа хранения. Поэтому грамотное редактирование доступно лишь через полное или частичное пересжатие. С желанием вырезать один кадр вообще выхода кроме как пересжимать не остается.
5. Черные полосы можно убрать только при полном пересжатии видео. Исключение составляет формат mkv, в котором есть параметры позволяющие указывать границы отображаемой области. Но поддержка этих опций плеерами практически отсутствует.

Структура сжатого видеопотока (теория)

Как устроена видеопоследовательность
При сжатии видео используется 3 типа кадров: I, P и B.
I-кадр - это кадр, который не зависит от других кадров и сжат с очень небольшим коэффициентом. Его так же называют ключевым кадром. При просмотре сжатого видео вся навигация осуществляется через ключевые кадры. В результате приходится распаковать лишь кусок от ближайшего ключевого кадра чтобы попасть в нужное место видео.
После I-кадров следует последовательность P-кадров, которые имеют гораздо большую степень сжатия, т.к. сохраняют лишь отличия от предыдущего кадра. Последовательность видео в этом случае может выглядеть так: IPPPPPPPPPPPPPPPPIPPPPPPP...
Для дальнейшего увеличения сжатия были введены B-кадры. Они ставятся между двумя менее сжатыми кадрами (I/P или P/P). Последовательность получается такой: IPBPBPBPBPBPBPIPBPBPBP… (или IBPBPBPBPBPBPBPIPBPBPBP…).
Коэффициент сжатия B-кадров больше, чем коэффициент сжатия P-кадров, т.к. сохраняются лишь отличия от соседних кадров. Но вместе с этим накладывается определённые ограничения. Например, вырезаемый фрагмент видео не может заканчиваться B-кадром.

Иллюстрация


В случае, если фрагмент видео заканчивается B-кадром и нельзя отступить в сторону чтобы попасть на P- или I-кадр, то придется пересжимать часть фрагмента начиная с последнего I-кадра и до конца (т.е. нужного кадра).

Контейнеры (теория)

Контейнер AVI

Описание

Компания Microsoft впервые выпустила пакет Video for Windows для операционной системы Windows 3.1 в ноябре 1992 года, и с тех пор формат AVI (Audio Video Interleave) является основным для хранения видео в операционных системах семейства Windows.
Основное преимущество универсального формата AVI (и, кстати, «секрет» его долголетия), в отличие от потоковых форматов типа MPEG, а тем более от таких специализированных разновидностей, как MP3 (MPEG Audio Layer 3), в том, что «стандартных» AVI-файлов практически не существует: AVI — фактически не более чем «контейнер», который содержит общее описание содержимого в стандартизованном виде.
Таким образом, AVI-файлы только внешне выглядят одинаково, но внутри они могут сильно различаться, и, в то время как MPEG-, MP3- и MJPEG-файлы содержат потоки только определенного вида сжатия (компрессии), AVI может содержать много различных видов компрессии в любых сочетаниях. Однако работать с AVI-файлом можно будет только пока необходимый кодек доступен для кодирования/декодирования.
Серьезным недостатком AVI-формата является то, что аудио- и видеофрагменты не содержат никаких меток времени или индексов кадра. Данные упорядочиваются по времени последовательно, в порядке поступления. Приложение для захвата или проигрывания видео должно само позаботиться о синхронизации видео- и аудиопотоков. Но если деление видео на кадры совершенно естественно, то звук представляет собой непрерывный поток, который приходится искусственно расчленять на фрагменты, соответствующие кадрам (из-за этого точная синхронизация изображения и звука часто отсутствует и звук может 'расходиться' с изображением). В простейшем случае каждому кадру видео соответствует кусок звукового сопровождения, но далеко не все AVI-файлы делаются по этой простой схеме.
Недостаток временных меток был устранен в расширении AVI-формата - OpenDML AVI (поддержанный затем в DirectShow и в ActiveMovie), которое добавляет новые куски по меткам времени.
Контейнер уже давно устарел и все никак не хочет уходить на пенсию, причем подавляющая часть медиа контента в сети до сих пор распространяется именно в нем. Минусы:
  • Для каждой цепочки AVI-файла теряется 24 байта на заголовки и индекс. Это приводит к потерям чуть более 5МБ/час.
  • Может быть сохранено только содержимое с фиксированной частотой кадров. Т.е. не возможно поместить в AVI смешанный материал, например, смесь NTSC видео и киноматериала. В действительности, есть хаки, позволяющие сохранять содержимое с переменным fps в AVI, но они увеличивают (и без того большую) избыточность впятеро или более того и поэтому непрактичны.
  • Аудио в AVI-файлах должно быть или с постоянным битпотоком (CBR) или с постоянным размером кадра (т.е. все кадры декодируются в одно и то же число выборок).
  • AVI не способен отличить P-кадр от B-кадра. Не предусмотрено спецификацией. DivX / Xvid решают эту проблему в обход спецификации, что тоже не совсем хорошо и может создавать проблемы.
  • Контейнер AVI создавался для работы через интерфейс VfW (Video for Windows) и как раз VirtualDub является программой, использующей исключительно VfW. Поскольку VfW является сильно устаревшим и не гибким, современные программы используют DS (DirectShow). Программы использующие DS замечательно работают с контейнерами под DS заточенными, но вот с VfW возникают проблемы в виде расхождения аудио и видеодорожек. Поэтому не следует использовать для работы с AVI-файлами программы, работающие не через VfW.
  • Отсутствует поддержка современных кодеков.

Структура

В соответствии с общей структурой RIFF-типа, AVI-файл должен иметь следующий вид:
RIFF 'AVI '     // четырехбуквенный идентификатор файла (в RIFF-формате)
LIST 'hdrl'     // список заголовков блоков, определяющих форматы потоков
LIST 'movi'     // блоки данных (потоков) AVI-файла
     'idx1'     // необязательный блок, определяющий размещение блоков данных внутри AVI-файла <AVI Index>
То есть в AVI-файле должно быть по крайней мере два обязательных блока: заголовка и данных, которые, в свою очередь, могут содержать подблоки. Первый блок будет содержать общую информацию о видеоролике: разрешение кадров и их частоту, формат аудио и т.д. Сначала в заголовке для записи длины потока отводилось 32 байт, поскольку в файловой системе FAT 16 максимальный раздел диска не мог превышать 2 Гбайт, поэтому и максимальный кусок видео, который можно было записывать в AVI-файле, не мог превышать 2 Гбайт (с учетом знака переменной размера). Во времена возникновения формата казалось естественным, что длина файла не может превышать размер логического диска. С появлением файловых систем FAT 32 и NTFS верхняя граница размера раздела значительно отодвинулась, однако потребовалось еще немало времени, чтобы ввести расширение формата и дождаться программ, способных это ограничение обходить.
Список 'hdrl' может состоять из подсписков:
LIST 'hdrl'     // список заголовков блоков, определяющих форматы потоков
     'avih'     // главный заголовок AVI-файла
LIST 'strl'
     'strh'     // заголовок потока
     'strf'     // формат потока
     'strd'     // дополнительный заголовок данных

Список 'movi', в свою очередь, состоит из подблоков:
LIST 'movi'                                          // блоки данных (потоков) AVI-файла
SubChunk | LIST 'rec '                               // подблок | список записей
                '##wb' (размер блока 4 байта) (data) // звуковые данные (блок)
                '##dc' (размер блока 4 байта) (data) // видеоданные (блок)
                '##db' (размер блока 4 байта) (data) // видеоданные (блок)
Таким образом, подблок данных организован в виде последовательности записей, каждая из которых состоит из одного кадра видео и соответствующего звукового сопровождения. Первоначально ##dc-блок был предназначен для хранения сжатого изображения, а ##db-блок - для несжатого DIB (Device Independent Bitmap). Но фактически они оба могут содержать сжатые данные.

Контейнер MKV

Описание

Современный, отвечающий всем потребностям, отличный контейнер.
Matroska (так по-английски пишется русское слово Матрёшка) — проект, нацеленный на создание открытого гибкого кросс-платформенного (включая аппаратные платформы) стандарта форматов мультимедийных контейнеров и набора инструментов и библиотек для работы с данными в этом формате. Этот проект является развитием проекта MCF, но значительно отличается тем, что основан на EBML (Extensible Binary Meta Language — расширяемый двоичный метаязык) — двоичном аналоге языка XML. Использование EBML позволяет расширять формат без потери совместимости со старыми программами.
Возможности формата, закладываемые в Matroska:
  • трансляция по Интернету (протоколы HTTP и RTP);
  • быстрая перемотка в файле;
  • устойчивость к ошибкам;
  • разбиение файла на главы (Chapters);
  • переключаемые на лету субтитры (с возможностью добавлять свои шрифты прямо в контейнер - без необходимости их отдельной установки в ОС);
  • переключаемые звуковые дорожки;
  • модульная расширяемость;
Следует отметить, что проект аудио/видео контейнера не включает в себя форматов сжатия видео и кодеков (таких, как MP3 или JPEG). Это упаковка, которая может содержать большое число потоков аудио, видео, субтитров и других медиа-данных (картинки, шрифты и т.д.), позволяя пользователю хранить в одном файле несколько вариантов фильма и проигрывать его мультимедиа-проигрывателем в необходимой конфигурации.
Matroska является открытым проектом (open standard). Это означает, что для персонального использования она абсолютно бесплатна, а техническая спецификация формата битового потока доступна любому, даже компаниям, желающим встроить поддержку формата в свои продукты (для этого потребуется специальная лицензия). Исходный код всех библиотек, созданных группой разработчиков проекта Matroska распространяется на условиях LGPL (библиотека для проигрывания, написанная на C с использованием целочисленной арифметики, распространятся также на условиях лицензии BSD).
Matroska является прямой открытой альтернативой контейнерам AVI, ASF video, MOV, RealMedia, MP4, MPG. Существует поддержка адаптации и реализации библиотек Matroska для OpenBeOS Mediakit и GStreamer (англ.) (мультимедийной среды ОС GNU/Linux, похожей на Microsoft DirectShow для Windows) и набора фильтров DirectShow для воспроизведения и создания файлов Matroska в ОС Windows.

Контейнер MP4

Описание

Контейнер, который является стандартом для MPEG-4.
Имеет ограничения: не может содержать внутри видео в форматах: WMV, MPEG1, MPEG2, и не может содержать внутри звук в форматах: AC3, MP2, WMA.

Контейнер TS, M2TS

Описание

Целью создания контейнера TS является мультиплексирование аудио и видео данных и синхронизация их выхода. Т.е. основное назначение - трансляция по сетям передачи данных. Для этих целей в контейнере хранится очень много служебной информации. Например, при объемах ~30Gb служебная информация будет занимать ~2Gb.
Поток транслируется пакетами по 188 байт, в которых содержится вся необходимая служебная информация (флаги, заголовки, идентификаторы, данные синхронизации и прочее). В m2ts пакет уже не 188 байт, а 192 байта. Добавляется информация о тайм-кодах для организации произвольного доступа к потоку.

Сравнение различных контейнеров (англ.)

Получение информации о типе каждого кадра сжатого видеопотока

Способ через ffmpeg

Устанавливаем последнюю версию фрейм-серера AviSynth.
Качаем последнюю версию ffmpeg. Из этого архива в папку "C:\Program Files\AviSynth 2.5\plugins\" копируем файл ffms2.dll. Если в архиве есть файл ffms2.avsi, то его копируем тоже. Файл содержит готовые полезные функции. В частности там описана используемая далее функция FFInfo. При наличии этого файла её не надо будет вставлять в скрипт.
Создаем текстовый файл с расширением *.avs и следующим содержимым:

Cкрипт (без использования файла ffms2.avsi&#41;

function FFInfo(clip c, bool "framenum", bool "frametype", bool "cfrtime", bool "vfrtime")
{
framenum = default(framenum,true)
frametype = default(frametype,true)
cfrtime = default(cfrtime,true)
vfrtime = default(vfrtime,true)
global fftempclip = c
fftempclip = frameevaluate(fftempclip, """ fftempstring = "" """)
fftempclip = framenum ? frameevaluate(fftempclip, """fftempstring = fftempstring + "Frame Number: " + string(current_frame) + " of " + string(fftempclip.framecount) + "\n" """, after_frame=true) : fftempclip
fftempclip = frametype ? frameevaluate(fftempclip, """fftempstring = fftempstring + "Picture Type: " + chr(FFPICT_TYPE) + "\n" """, after_frame=true) : fftempclip
fftempclip = cfrtime ? frameevaluate(fftempclip, """fftempstring = fftempstring + "CFR Time: " + FFFormatTime(int((current_frame * 1000) / fftempclip.framerate)) + "\n" """, after_frame=true) : fftempclip
fftempclip = vfrtime ? frameevaluate(fftempclip, """fftempstring = fftempstring + "VFR Time: " + FFFormatTime(FFVFR_TIME) + "\n" """, after_frame=true) : fftempclip
return scriptclip(fftempclip, "subtitle(fftempclip, fftempstring, lsp = 1)", after_frame=true)
}


LoadPlugin("C:\Program Files\AviSynth 2.5\plugins\ffms2.dll")
FFVideoSource("C:\Film.avi")
FFInfo(cfrtime = false, vfrtime = false)

Cкрипт (если используется файл ffms2.avsi&#41;

LoadPlugin("C:\Program Files\AviSynth 2.5\plugins\ffms2.dll")
FFVideoSource("C:\Film.avi")
FFInfo(cfrtime = false, vfrtime = false)
Открываем его в любом проигрывателе или редакторе вроде VirtualDub / VirtualDubMod или AvsP / AvsPmod.
Сначала придется подождать, это нормально. Видео индексируется.
Видим результат:

Иллюстрация




Способ через ffdshow

Устанавливаем последнюю версию фрейм-серера AviSynth.
Ставим последнюю версию ffdshow. Во время установки никакие опции трогать не надо. После установки заходим в меню "Пуск->Программы->ffdshow->Конфигурация видеодекодера". В списке слева отмечаем пункт "OSD", в открывшемся списке справа отмечаем пункт "Тип кадра" и подтверждаем изменения нажатием кнопки "OK".

Иллюстрация


Создаем текстовый файл с расширением *.avs и следующим содержимым:

Cкрипт

DirectShowSource("c:\film.avi")
Открываем его в любом проигрывателе или редакторе вроде VirtualDub / VirtualDubMod.
Видим результат:

Иллюстрация




[Профиль] [ЛС]
Показать сообщения:    
Тема закрыта

Текущее время: 21-Ноя 12:13

Часовой пояс: UTC + 3



Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы