Voici une description plus détaillée des formats de sous-titres les plus courants. Que sont les sous-titres ? Comment activer les sous-titres ? Construire avec tsMuxeR
Le format Bluray m2ts permet deux types de superpositions à l'écran qui peuvent être utilisées pour les fichiers . L'un est basé sur du texte, mais pour l'instant, je n'ai vu aucun BluRay utiliser celui-ci pour les sous-titres. L'autre est le PGS (flux graphique de présentation) et consiste en des bitmaps (et des délais sur lesquels ils doivent être affichés). Ce deuxième flux est de loin le plus couramment utilisé par les BluRays. Comme nous le verrons ci-dessous, des outils existent pour extraire ce flux vers des fichiers .sup. Ce n'est pas le même format que les fichiers .sup que certains outils extraient des DVD.
Notez que les HD DVD ont également un format .sup légèrement différent de celui du BluRay. Dans la mesure où le PCH n'est pas (encore) capable d'afficher les PGS, la seule façon d'obtenir des sous-titres pour le matériel ts ou m2ts est d'utiliser un fichier texte secondaire (.srt) contenant les sous-titres.
Extraire le sous-titre PGS d'un Bluray
Vous avez besoin des outils suivants :
eac3to
tsMuxer
Vous pouvez les trouver sur Google.
Ouvrez une fenêtre cmd (Exécuter : cmd)
Assurez-vous que eac3to est accessible dans votre chemin (par exemple si eac3to est installé dans le dossier C:\Program Files\eac3to\) :
"set PATH=%PATH%;E:\Program Files\eac3to"
Allez dans le dossier qui contient votre fichier m2ts,
cd MEDIA\REMUXED\Le Film\BDMV\STREAM
Faites eac3 pour vous indiquer quels flux se trouvent dans vos m2ts,
chaque3à1)
Exemple de sortie :
M2TS, 1 piste vidéo, 1 piste audio, 3 pistes de sous-titres, 2:08:45, 24p /1.001
1 : Chapitres, 37 chapitres
2 : h264/AVC, 1080p24 /1.001 (16:9)
3 : DTS Master Audio, anglais, 5.1 canaux, 24 bits, 48 khz
(noyau : DTS, 5.1 canaux, 24 bits, 1509 kbps, 48 kHz)
4 : Sous-titre (PGS), anglais
5 : Sous-titre (PGS), français
6 : Sous-titre (PGS), français
Si votre dossier contient plusieurs fichiers m2ts, exécutez d'abord eac3to sans argument, il affichera tous les fichiers disponibles sous la forme : 1) 00000.mpls, 00001.m2ts, 2:08:45 / 2) 00001.mpls ..., puis choisissez le numéro que vous souhaitez explorer.
Convertisseur vidéo WinX HD Deluxe
Meilleur téléchargeur et convertisseur vidéo/musique, éditeur vidéo, convertisseur DVD, enregistreur vidéo/webcam pour Windows (10) et Mac. Vitesse de traitement vidéo ultrarapide avec l'accélération matérielle Nvidia/Intel/AMD.
Vous n'avez pas trouvé les sous-titres requis sur Internet ? Pas de problème : ils peuvent être « extraits » d’un DVD Vidéo ou d’un disque Blu-ray. Mais il est impossible d’utiliser de tels mots interlinéaires dans des conteneurs multimédias. Parlons aujourd'hui de la façon de les rendre compatibles avec la plupart des formats vidéo.
Je vais d’abord décrire la tâche. De nombreux cinéphiles préfèrent regarder des films en langue originale sous-titrés, même s’il existe une traduction. Il y a plusieurs raisons à cela, mais en discuter dépasse le cadre de cet article (je dirai simplement que je le fais souvent moi-même). Ce n’est également un secret pour nos lecteurs que les supports optiques appartiennent progressivement au passé. Ceux qui disposent d'un serveur multimédia domestique sont soit en train de convertir leur collection de films au format sans disque, soit du moins ont commencé à y réfléchir. Le plus souvent, les fichiers MKV sont utilisés pour le stockage à domicile.
Extrayez les sous-titres à l’aide de HD-DVD/Blu-Ray Stream Extractor. Vous pouvez supprimer tous les threads du conteneur
Il existe de nombreux outils pour les créer – par exemple HandBrake (handbrake.fr), que j'ai récemment décrit dans l'article « Omnivorous Generalist » (voir UPgrade #15-16 (570-571)). Le seul problème vraiment sérieux auquel sont confrontés ceux qui réalisent leurs propres rips est l’obtention de sous-titres. Le fait est que les DVD Vidéo et Blu-ray utilisent généralement ce qu'on appelle. sous-titres pré-rendus – il s'agit d'une image prête à l'emploi qui est simplement superposée au cadre (en savoir plus sur les types de sous-titres : ru.wikipedia.org/wiki/Subtitles).
Mais seuls les textes peuvent être « cousus » dans les conteneurs Matroska (en fait, il existe un moyen de mettre des sous-titres « déchirés » d'un disque optique dans des fichiers MKV, mais cela est fortement déconseillé en raison de problèmes de compatibilité - de nombreux joueurs ne le verront tout simplement pas. eux) . En revanche, la recherche sur Internet de sous-titres sous forme de texte (SRT/SMI) ne donne pas toujours le résultat souhaité, notamment pour des publications comme le « Extended Director's Cut » ou, disons, des films peu appréciés du grand public. consommateur de cinéma. Vous devez donc d'une manière ou d'une autre extraire le texte interlinéaire du disque, le convertir au format requis, puis le transmettre au convertisseur.
Pour un œil non averti, la tâche se résume à une simple reconnaissance de texte. Et en effet, si vous tapez l'expression « FineReader Blu-ray » dans la barre de recherche Google, dans les cinq premiers résultats, vous trouverez un lien vers des instructions assez détaillées en russe sur la façon de procéder. Mais, d'une part, vous devrez utiliser un logiciel commercial, et d'autre part, le processus s'avère assez laborieux. En général, ce n’est pas notre choix : nous allons minimiser les mouvements du corps et nous contenter de logiciels libres.
Premièrement, ces mêmes sous-titres pré-rendus doivent être obtenus d’une manière ou d’une autre. La méthode exacte dépend du format source. Laissez-moi juste dire que dans tous les cas, vous aurez besoin d'une copie du film sur votre disque dur. Mais comme pirater la sécurité est une action illégale, nous devrons nous abstenir de la décrire. Je pense que n'importe qui peut facilement trouver un manuel sur Internet.
Dans le cas du Blu-ray, nous prenons l'utilitaire de console eac3to (madshi.net/eac3to.zip). À propos, vous pouvez y « visser » une sorte de coque graphique, qui est assez nombreuse. Personnellement, j'ai aimé HD-DVD/Blu-Ray Stream Extractor (code.google.com/p/hdbrstreamextractor), que je recommande. Tout ce que vous avez à faire est de décompresser l'archive résultante dans le même répertoire où réside eac3to, puis d'exécuter HdBrStreamExtractor.exe. Vous devez maintenant cliquer sur le bouton à droite du champ de saisie (info-bulle Sélectionner le(s) fichier(s) d'entrée), sélectionner le fichier le plus volumineux du dossier STREAM avec l'extension *.m2ts, puis spécifier le répertoire de destination dans le champ Sortie.
Tout ce que vous avez à faire est de cliquer sur Fonctionnalité(s) et d'attendre que le programme ait fini de lire le conteneur. Après cela, une liste des flux détectés apparaîtra dans la section Flux(s). Si vous le souhaitez, extrayez tout, si vous le souhaitez, uniquement les sous-titres : cochez simplement la case à côté de ce que vous souhaitez extraire, puis démarrez le processus avec le bouton Extraire.
Après un certain temps (qui dépend principalement de la vitesse du PC ; sur les machines modernes, l'extraction des sous-titres des disques Blu-Ray prend généralement un peu plus d'une heure), le dossier contenant les résultats du travail contiendra des fichiers avec l'extension * .sup et des noms non informatifs comme 1_7_subtitle (le deuxième numéro, dans ce cas – 7, signifie le numéro de fil). Ce sont nos sous-titres « en images », qu’il faut désormais reconnaître.
Si nous parlons de DVD vidéo, vous devez utiliser un utilitaire appelé VobSub Ripper Wizard du célèbre Gabest. Il est inclus dans Gordian Knot et d'autres packages similaires. Cependant, il n'est pas du tout nécessaire d'encombrer votre disque dur de logiciels inutiles : VSRip se trouve sur : sourceforge.net/projects/guliverkli/files/VSRip. Il existe une archive ZIP dans laquelle se trouve un seul fichier exécutable. L'interface du programme (qui, soit dit en passant, a été publiée en 2003, mais fonctionne parfaitement sous Windows 7 x64) est primitive.
La première chose à faire est d'ouvrir le fichier contenant les informations de service (bouton Charger IFO...), qui correspondent aux conteneurs dans lesquels le film lui-même est stocké. Déterminer lequel est assez simple : vous devez accéder au dossier VIDEO_TS et y trouver n'importe quel fichier VOB de 1 Go.
Supposons qu'il s'appelle VTS_01_1 - alors l'extracteur doit « alimenter » VTS_01_1.IFO (en d'autres termes, les chiffres dans les noms après le jeu de caractères « VTS_ » doivent correspondre). Ce qu'il faut indiquer dans le champ Enregistrer dans... - devinez par vous-même (sourire). Ensuite, cliquez sur Suivant et à l'étape suivante de l'assistant, sélectionnez les sous-titres dans les langues requises dans la liste Langues. Il est important ici que toutes les positions dans la colonne Vob/Cell IDs soient sélectionnées - sinon les sous-titres seront extraits avec des espaces. Cliquez à nouveau sur Suivant et nous obtenons deux fichiers de sortie avec les mêmes noms et extensions *.idx et *.sub. C’est ce dont nous avons besoin.
La structure interne des sous-titres extraits de DVD vidéo et de Blu-ray diffère. Pour ces derniers, vous pouvez utiliser le moteur de reconnaissance SupRip (exar.ch/suprip), qui remplit généralement sa tâche - bien que
et je ne peux pas dire que c'est parfait. Elle est capable de « déchiffrer » l'anglais bien mieux que le russe (mais si vous voulez, essayez-le, personne ne l'interdit). Elle n’est pas familière avec les sous-titres « vidéo ». Les gens leur recommandent le logiciel SubRip (zuggy.wz.cz) - au fait, faites attention : les noms ne diffèrent que par une lettre, mais ce sont des programmes différents.
D'une manière ou d'une autre, cela n'a pas fonctionné pour moi avec le deuxième : je n'ai jamais réussi à le faire fonctionner avec le « sept » 64 bits. Votre humble serviteur ne s'est jamais plaint de mains tordues auparavant - même si, bien sûr, tout peut arriver. Peut-être que la vérité - comme dans la célèbre série télévisée - se trouve quelque part à proximité, mais je n'ai pas pu la découvrir. Ensuite, j'ai essayé plusieurs autres utilitaires similaires, mais je n'ai trouvé aucune compréhension avec aucun d'entre eux. J'écris à ce sujet uniquement pour que vous ne répétiez pas mes erreurs.
Il existe une solution universelle, appelée Subtitle Edit (www.nikse.dk/SubtitleEdit). Ce que j'ai aimé dans cet éditeur, c'est qu'il est formé pour reconnaître les deux types de sous-titres pré-rendus et plus encore. Il est distribué à la fois sous la forme d'une archive qui ne nécessite pas d'installation et sous la forme d'un programme d'installation, en substance, ils ne sont pas différents ; L'interface est parfaitement russifiée (Options > Choisir la langue), et on trouve également une aide en ligne assez détaillée dans la langue - pardonnez la banalité - de Pouchkine et de Dostoïevski. Le moteur open source Tesseract OCR est utilisé pour la reconnaissance (code.google.com/p/tesseract-ocr).
Cependant, avant que le programme puisse fonctionner avec les sous-marins russes, il faut faire quelque chose. Tout d'abord, allez sur le site Web du moteur mentionné ci-dessus, recherchez le fichier rus.traineddata.gz dans la section téléchargements, téléchargez-le et placez-le dans le dossier Tesseract\tessdata du répertoire du programme Subtitle Edit. Ensuite, nous redémarrons l'éditeur, ouvrons le menu « Orthographe » > « Obtenir les dictionnaires... » et dans la liste déroulante, sélectionnons l'élément appelé Orthographe russe, césure, thésaurus, puis cliquez sur « Télécharger » (je pense qu'il n'y a pas d'explication particulière est obligatoire ici). Maintenant, tout est prêt.
Pour reconnaître les sous-titres obtenus à partir d'un DVD Vidéo, utilisez l'élément « Importer/OCR VonSub (sub/idx) sous-titres » dans le menu « Fichier » ; pour une opération similaire avec les sous-titres de disques optiques où la vidéo HD est stockée, utilisez « » Importer/OCR un fichier sup Blu-ray..."
Dans le premier cas, il vous sera demandé de sélectionner un flux avec la langue souhaitée (s'il y en a plusieurs), dans le second, l'assistant sera lancé immédiatement. La suite de la procédure ne diffère pas. Dans le champ « Méthode OCR », il faut laisser la rubrique « OCR utilisant Tesseract », dans le champ « Langue », sélectionner celle qui correspond à la langue des sous-titres, et dans la liste « OCR/Correction orthographique », la smart le programme lui-même sélectionnera l'option appropriée si les dictionnaires appropriés sont installés. Je vous conseille également d'activer l'option « Requête de mots inconnus » - il vous sera alors demandé de corriger manuellement un mot inconnu du correcteur orthographique.
Avec un peu de formation, il faut 30 à 40 minutes pour traiter les sous-titres russes d'un film de 2 heures. Avec l’anglais, les choses vont encore plus vite. Une fois le processus terminé, les sous-titres texte doivent être écrits sur le disque (« Fichier » > « Enregistrer », laissez SubRip dans le champ « Type de fichier »). Subtitle Edit dispose également d'une fonction « Synchronisation » très utile, qui vous aidera à recalculer les codes temporels d'une fréquence d'images à une autre (utile si vous souhaitez joindre des sous-titres obtenus à partir d'un DVD vidéo à une extraction BD).
En théorie, après avoir reçu les sous-titres SRT, ceux-ci peuvent être immédiatement encapsulés dans un conteneur. Mais comme la reconnaissance automatique fait souvent des erreurs, il vaut mieux les éditer dans un éditeur. Personnellement, j'ai aimé le Srt Corrector gratuit. Mais comme, comme toujours, il n'y avait pas assez d'espace alloué pour l'article, recherchez sa description détaillée dans « Petits programmes » dans le même numéro d'UPgrade. EN HAUT.
Quelle est la manière la plus simple de convertir les sous-titres PGS en SRT avec l'outil Subtitle Converter sous Windows ou Mac ? Je ferai référence à un problème pour vous expliquer comment convertir des sous-titres PGS en SRT avec SupRip, BDSup2Sub ou ByteCopy.
1. Qu'est-ce que SupRip ?
(à ne pas confondre avec SubRip) est un programme qui permet de formater les fichiers SUP au format Blu-ray et HD-DVD par OCR (tels que ceux exportés par eac3to), et peut ensuite exporter des fichiers de sous-titres au format SRT qui peuvent être multiplexés dans MKV ou d'autres conteneurs, ou lu comme sous-titres externes par des lecteurs compatibles. Il vous permet d'extraire les sous-titres d'un DVD avec leur timing sous forme de fichier texte. Il convertit vobsub(sub et idx) en sous-titres texte srt ( vobsub à srt / sous à srt / sous-titre / sous2srt ) à l'aise. Pourtant, le programme peut faire plus pour vous. En fait, il est également capable de convertir les sous-titres Blu-ray .sup en .srt avec l'option OCR. Vous trouverez ci-dessous quelques informations sur le convertisseur de sous-titres – SubRip Avantages:
- Extrait les sous-titres DVD, les sous-titres images, les sous-titres PNG et les sous-titres CODÉS EN DUR !
- Apprend bien lors de l'entraînement.
- Peut être modifié (en utilisant semi-source) par un utilisateur averti pour créer du texte non latin.
- Difficile d'étendre au texte non latin par l'utilisateur moyen
- OCR a du mal à lire les sous-fichiers impairs de temps en temps. Outil indispensable pour les films en langue étrangère.
- Plus lent que certains éventreurs.
Systèmes d'exploitation compatibles : Windows XP, 2000, Vista (Windows UNIQUEMENT)
2. Que sont les sous-titres PGS et SRT ?
– L'extension de fichier .sup signifie image bitmap de sous-titre extraite d'un film Blu-ray ; il contient des graphiques de texte de sous-titres affichés pendant la lecture d'un film. Les sous-titres .sup sont codés avec le codec PGS et parfois appelés sous-titres PGS. Les sous-titres Blu-ray PGS ne sont pas aussi largement pris en charge par les lecteurs multimédias HD que les sous-titres DVD et doivent généralement être convertis en un format de sous-titres plus courant comme SRT, SSA, IDX, ASS, etc. Lorsqu'un Blu-ray est extrait en flux .m2ts, les sous-titres .sup peuvent être extraits en démultiplexant le M2TS à l'aide de tsMuxer. – Le .srt est principalement associé aux DivX, DVD et à certains autres formats vidéo (par exemple MKV) en tant que format de sous-titre externe. Les fichiers SRT sont des fichiers texte utilisés dans la lecture vidéo. Par conséquent, ils ne contiennent aucune donnée vidéo, mais ils incluent l'heure à laquelle chaque sous-titre doit être affiché suivi du texte du sous-titre.
- En savoir plus:
3. Tutoriel SupRip – Conversion des sous-titres PGS .sup en .srt à l'aide de SupRip
Téléchargement de SupRip v1.16 (Windows UNIQUEMENT, utilisateurs Mac, vous pouvez essayer cette application si vous extrayez un Blu-ray sur Mac, ce qui vous permet de convertir les sous-titres Blu-ray .sup directement à partir d'un disque Blu-ray) Étape 1. Démarrez SupRip, chargez le fichier SUP avec le bouton « Ouvrir ».
Étape 2. Cliquez sur « Auto-OCR » pour analyser automatiquement l'intégralité du fichier et laisser seuls les caractères inconnus. Étape 3. Accédez à l'onglet SRT.
Étape 4. Vérifiez les sous-titres et les statistiques. Modifiez certaines options si vous le souhaitez.
Étape 5. Enregistrez le fichier SRT avec le bouton « Enregistrer ».
Comment nommer plusieurs fichiers srt pour que la langue indique la sélection : 1. nommez les sous-titres exactement comme le flux vidéo. Par exemple. 00033.m2ts-> 00033.srt 2. donnez un identifiant aux sous-titres dans différentes langues. Par exemple. nom sous-titres anglais xxx.en.srt et sous-titres allemands xxx.de.srt
Qu'est-ce qui est ennuyeux– il y a beaucoup de fautes d’orthographe et de caractères indiscernables lorsque l’Auto-OCR est utilisé, et vous devez les vérifier et les corriger un par un.
Vous aurez le plus grand plaisir à regarder un film dans sa langue originale. Et comme on ne connaît souvent pas la langue originale ou qu’on la connaît mal, les sous-titres sont nécessaires. De plus, les sous-titres sont une bonne opportunité pour apprendre la langue.
Les sous-titres peuvent être appliqués au moment de l'encodage de la vidéo ou au moment de sa lecture (temps réel). Dans le premier cas, les sous-titres sont intégrés, dans le second, externes. Les sous-titres externes présentent de nombreux avantages par rapport aux sous-titres intégrés. Ils sont toujours clairs et faciles à lire, quels que soient la qualité vidéo et les paramètres du décompresseur. Et bien sûr, le principal avantage est qu’ils peuvent être désactivés.
Formats
Il existe plusieurs formats pour présenter des sous-titres externes. Chaque format a ses propres avantages et inconvénients. Les plus courants sont srt, ssa, smi. srt est l'un des plus simples et des plus intuitifs ; ssa - le plus sophistiqué ; et smi est pris en charge par Microsoft.
Le fichier de sous-titres contient une structure contenant des informations sur le moment et le texte à superposer sur l'image.
La durée d'affichage est déterminée soit par l'image de début et de fin (sous-titres basés sur l'image), soit par l'heure de début et de fin de la phrase (sous-titres basés sur le temps). Une phrase se compose d’une ou plusieurs lignes de test. Des formats plus complexes déterminent la couleur et la position du texte, sa taille et les effets utilisés. Parfois, le fichier de sous-titres contient<шапку>- un titre qui indique à quel film sont destinés ces sous-titres, qui les a réalisés et d'autres informations.
D'où viennent les sous-titres :
- DVD La société de DVD inclut généralement des sous-titres pour le film sorti dans une ou plusieurs langues. Extraire ces sous-titres d'un DVD n'est pas difficile. Il est très pratique d'utiliser le programme SubRip pour cela. Ces sous-titres sont généralement très bien synchronisés et traduits correctement.
- Fansub Jusqu'à ce qu'un certain anime soit officiellement publié en Amérique, sa traduction peut être effectuée par des fans - des fansubers. Généralement, ces sous-titres sont au format SSA, car ils sont chronométrés dans SubStation Alpha. Ils sont principalement destinés à la sortie sur bande à l'aide du périphérique GenLoc. Ces sous-titres sont souvent moins bien traduits que les sous-titres officiels visibles sur les DVD, et sont souvent mal chronométrés. Mais tous les avantages du format SSA sont exploités pour modifier la taille et la couleur de la police ainsi que la position des sous-titres superposés. Étant donné que ces sous-titres sont créés par des fans pour des fans, ils ne traduisent pas, par exemple, les suffixes nominaux, qui devraient de toute façon être compréhensibles pour le fan.
Voici une description plus détaillée des formats de sous-titres les plus courants.
SubRipper (*.srt)
Les fichiers portent l'extension srt. Il s'agit du format natif de sous-titres du programme SubRip (by Brain). Il s'agit du programme le plus populaire pour extraire les sous-titres des DVD. Le format lui-même est simple et clair, se synchronisant avec la vidéo en fonction du temps avec une précision à la milliseconde. Un format très courant. Les fichiers SRT sont très pratiques à éditer - il est préférable de faire des traductions dans des fichiers SRT. Le format étendu permet de modifier certains paramètres de police (style, couleur) et la position des sous-titres à l'écran, mais peu de gens le supportent. Pas de chapeaux. Les sous-titres sont séparés les uns des autres par une ligne vierge ; la fin du fichier est marquée par un double saut de ligne (critique pour certains lecteurs et convertisseurs).
Exemple de fichier :
Citation:
1
00:00:03,600 --> 00:00:07,630
0-3-3, 0-3-5, 0-3-8,
Pas de contact.2
00:00:07,700 --> 00:00:09,100
Je t'ai eu.
...222
00:24:50,220 --> 00:24:53,880
Maintenant ils vont agir
confiant, n'est-ce pas ?
un fichier de sous-titres est un ensemble de phrases au format suivant.
N
HH:MM:SS:MLS --> hh:mm:ss:MLS
Première ligne de la phrase
Deuxième ligne de la phrase
Où
N - numéro de phrase
HH:MM:SS:MLS - heure de début de l'affichage de la phase en heures, minutes, secondes et millisecondes (mls)
hh:mm:ss:mls - heure de début de l'affichage de la phase en heures, minutes, secondes et millisecondes (mls)
il y a un espace entre le temps et la flèche.
SAMI (*.smi)
Les fichiers portant l'extension *.smi sont un format de sous-titres de Microsoft appelé SAMI (Synchronized Accessible Media Interchange). . Ce format est bien documenté et possède une structure complexe et extensible. En fait, SAMI est un sous-ensemble de SGML, comme HTML, et lui est donc très similaire. Ce langage de balisage est le résultat du travail du Caption Center du WGBH visant à introduire le sous-titrage codé à la télévision pour les sourds, les malentendants et les apprenants de langues étrangères. La norme prend en charge la modification de la taille, de la couleur, de la police et du style de la police, ainsi que la modification de la position sur l'écran. De plus, il prend en charge les styles. La syntaxe de style est similaire à celle du CSS du W3C. Synchronisation de l'heure. Le principal avantage de ce format est qu'il est pris en charge par Microsoft et peut donc être lu sans problème sur un Windows Media Player classique (ver >= 5). Il convient également de mentionner que parfois les fichiers au format SMIL portent l'extension smi (). ce sont des sous-titres pour RealPlayer), mais ils ne doivent pas être confondus avec les sous-titres SAMI. L'extension correcte des fichiers SMIL est *.smil.
Voici un exemple de fichier SAMI typique :
Citation:
Sous-titre créé par SubConv
0-3-3, 0-3-5, 0-3-8,
Pas de contact.
Je t'ai eu.
Maintenant ils vont agir
confiant, n'est-ce pas ?
le fichier de sous-titres se compose de deux parties, enfermées dans une balise commune
l'en-tête comprend à son tour des sections