|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2023-24
Transcodificación de la resolución espacial de vídeo bajo el estándar VVC |
Tecnologías Específicas
Tecnologías de la Información
Descripcion y Objetivos
Los estándares de vídeo son normas que regulan la codificación, la transmisión y/o la reproducción de contenidos de vídeo. Su objetivo es mejorar la calidad, la eficiencia de compresión y la compatibilidad de los contenidos para distintos dispositivos y plataformas. Entre los estándares más populares y avanzados se encuentra Versatile Video Coding (VVC), desarrollado por la Joint Video Exploration Team (JVET) y en vigor desde 2020 [1]. Comparado con el estándar previo, High Efficiency Video Coding (HEVC), VVC es capaz de alcanzar un 50% de eficiencia de codificación para un mismo nivel de calidad subjetiva [2]. Cabe reseñar, además, que VVC es compatible con resoluciones de hasta 16K y velocidades de fotogramas de hasta 120 fps, y admite formatos como High Dynamic Range (HDR) y una amplia gama de aplicaciones: realidad virtual, vídeo 360º, etc.
Por su parte, técnicas como Dynamic Adaptive Streaming over HTTP (DASH) [3], también conocida como MPEG-DASH, permiten transmitir contenido multimedia de alta calidad por Internet desde servidores web convencionales. Para ello, MPEG-DASH se basa en el protocolo HTTP, ampliamente utilizado y compatible con la mayoría de los dispositivos y redes. MPEG-DASH funciona dividiendo el contenido en segmentos pequeños y codificándolos a diferentes niveles de calidad o resolución. De esta forma, el reproductor de vídeo puede ajustar la calidad del streaming según las condiciones de la red, evitando interrupciones o retrasos en la reproducción.
Ante la esperable basta cantidad de contenidos codificados en formato VVC [4] y dada la considerable complejidad computacional del codificador frente a estándares anteriores, la existencia de algoritmos que permitan convertir contenidos de vídeo a resoluciones inferiores para su adaptación a MPEG-DASH de forma rápida y eficiente supondría un ahorro significativo de recursos computacionales para las empresas del sector de consumo de vídeo bajo demanda, tales como Netflix o HBO. Este proceso de transformación es conocido como transcodificación homogénea.
En este contexto, este TFG propone como objetivo el desarrollo de un transcodificador homogéneo para el estándar VVC que permita convertir la resolución de la secuencia de vídeo de entrada en una resolución de salida inferior. Para acelerar este proceso de forma significativa, el transcodificador habrá de utilizar la información de codificación existente en la secuencia original, reduciendo así significativamente el tiempo de codificación de la secuencia resultante. El códec empleado como base para el desarrollo será VVenC [5], desarrollado por el laboratorio Fraunhofer HHI y de libre disposición.
Metodología y Competencias
Se llevarán a cabo reuniones periódicas semanales o bisemanales en las que se llevará a cabo un control del progreso del siguiente plan de trabajo:
- Revisión de los conceptos básicos sobre codificación de vídeo, y sobre el estándar VVC en particular.
- Revisión y análisis del codificador de vídeo de libre disposición VVenC.
- Análisis y diseño de una propuesta de transcodificación homogénea del estándar VVC para reducir la resolución de una secuencia de vídeo.
- Desarrollo de la propuesta.
- Evaluación de la propuesta en un entorno real sobre múltiples secuencias de vídeo.
- Escritura de la memoria.
Las competencias desarrolladas a lo largo de este proyecto son:
- [CO1] Capacidad para diseñar, desarrollar, seleccionar y evaluar aplicaciones y sistemas informáticos, asegurando su fiabilidad, seguridad y calidad, conforme a principios éticos y a la legislación y normativa vigente.
- [CO6] Conocimiento y aplicación de los procedimientos algorítmicos básicos de las tecnologías informáticas para diseñar soluciones a problemas, analizando la idoneidad y complejidad de los algoritmos propuestos.
- [CO7] Conocimiento, diseño y utilización de forma eficiente de los tipos y estructuras de datos más adecuados para la resolución de un problema.
- [TI1] Capacidad para comprender el entorno de una organización y sus necesidades en el ámbito de las tecnologías de la información y las comunicaciones.
- [TI6] Capacidad de concebir sistemas, aplicaciones y servicios basados en tecnologías de red, incluyendo Internet, web, comercio electrónico, multimedia, servicios interactivos y computación móvil.
Medios a utilizar
Los recursos software utilizados por este trabajo son de libre disposición. Cualesquiera medios hardware requeridos por el alumno o alumna para su realización podrán ponerse a su disposición en la ESII o en el I3A.
Bibliografía
- [1] Information technology — Coded representation of immersive media — Part 3: Versatile video coding. ISO/IEC 23090-3:2022, ISO, 2022.
- [2] B. Bross et al., "Overview of the Versatile Video Coding (VVC) Standard and its Applications," in IEEE Transactions on Circuits and Systems for Video Technology, vol. 31, no. 10, pp. 3736-3764, Oct. 2021, doi: 10.1109/TCSVT.2021.3101953.
- [3] Information technology — Dynamic adaptive streaming over HTTP (DASH) — Part 1: Media presentation description and segment formats. ISO/IEC 23009-1:2022, ISO, 2022.
- [4] Cisco, “Cisco Annual Internet Report (2018–2023),” 2020. [Online] Available: https://www.cisco.com/content/en/us/solutions/collateral/executive-perspectives/annual-internet-report/white-paper-c11-741490.pdf
- [5] Fraunhofer HHI, “Fraunhofer Versatile Video Encoder (VVenC),” 2023. [Online] Available: https://github.com/fraunhoferhhi/vvenc
Tutor CEBRIAN MARQUEZ, GABRIEL | Alumno MARTÍNEZ HERRERO, PEDRO JESÚS |
| |