Deep Learning for Image/Video Restoration and Super-resolution
Cette monographie présente une vue d'ensemble des développements récents et de l'état de l'art en matière de restauration d'images/vidéos et de super-résolution (SR) à l'aide de l'apprentissage profond. L'apprentissage profond a eu un impact significatif, non seulement sur la vision par ordinateur et le traitement du langage naturel, mais aussi sur les problèmes classiques de traitement du signal tels que la restauration/sur-résolution d'images/vidéos et la compression. Les progrès récents en matière d'architectures neuronales ont permis d'améliorer considérablement les performances de la restauration d'images/vidéos et de la RS par apprentissage. Un avantage important des approches d'apprentissage profond axées sur les données est que les modèles neuronaux peuvent être optimisés pour toute fonction de perte différentiable, y compris les fonctions de perte visuelles perceptuelles, ce qui conduit à la restauration vidéo perceptuelle et à la RS, qui ne peuvent pas être facilement traitées par les approches traditionnelles basées sur des modèles.
La publication commence par un énoncé du problème et une brève discussion sur les solutions traditionnelles par rapport aux solutions basées sur les données. Ensuite, les avancées récentes en matière d'architectures neuronales sont examinées, ainsi que les fonctions de perte et les critères d'évaluation pour la restauration d'images/vidéos et la RS. La restauration d'images et la RS apprises sont également examinées, comme l'apprentissage d'un mappage de l'espace des images dégradées vers les images idéales basé sur le théorème d'approximation universelle, ou un modèle génératif qui capture la distribution de probabilité des images idéales. Les problèmes pratiques liés à l'application de l'apprentissage supervisé à la restauration et à la RS dans la vie réelle sont également inclus, de même que les modèles de solution.
Dans la section sur la RS vidéo apprise, les approches permettant d'exploiter les corrélations temporelles dans le traitement vidéo appris sont couvertes, puis l'optimisation perceptuelle des paramètres du réseau pour obtenir une texture et un mouvement naturels est discutée. Une discussion comparative des différentes approches conclut la publication.
© Book1 Group - tous droits réservés.
Le contenu de ce site ne peut être copié ou utilisé, en tout ou en partie, sans l'autorisation écrite du propriétaire.
Dernière modification: 2024.11.14 07:32 (GMT)