Resultados 1 al 17 de 17

Tema: Tutorial: OCR básico y avanzado «Subtitle Workshop» + Traducción

  1. #1
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 369

    Idea Tutorial: OCR básico y avanzado «Subtitle Workshop» + Traducción

    Trataré de hacerlo lo más sencillo posible y con ejemplos.

    Lo primero es conocer las líneas y para que sirve cada una:

    Las expresiones regulares se usan solo para buscar; para sustituir algo tiene que estar entre paréntesis. En «False» se sustituye toda la expresión.
    UseREOnlyToFind="True"

    Si UseRE está en «False» se pueden utilizar las siguientes 3 líneas.
    UseRE="False"

    Buscar palabra entera.
    WholeWord="True"

    Distinguir entre mayúsculas y minúsculas.
    CaseSensitive="True"

    Preservar mayúsculas y minúsculas. Es útil para corregir ortografía.
    PreserveCase="True"


    Básico:


    Aquí vamos a buscar y sustituir la palabra «Ilámame» por «llámame».
    <ERROR UseRE="False" Find="Ilámame" WholeWord="True" CaseSensitive="True" ReplaceBy="llámame">

    Aquí corregiremos dos o más palabras.
    <ERROR UseRE="False" Find="si quiera" WholeWord="True" CaseSensitive="True" ReplaceBy="siquiera">

    Aquí cambiaremos la «l» por «i» en los casos como: Misterio, misterioso, Misteriosa...
    <ERROR UseRE="False" Find="misterl" PreserveCase="True" ReplaceBy="misteri">


    Avanzado:

    Abreviaturas compuestas ej. «Sr.» «Dr.» «a. m.»
    <ERROR UseREOnlyToFind="False" Find="\b[Ss]r\b\s" ReplaceBy="Sr. ">
    <ERROR UseREOnlyToFind="False" Find="\b[Aa]\.?[Mm]\b\.?" ReplaceBy="a. m.">
    <ERROR UseREOnlyToFind="True" Find="\b(h\b\.?|hs\b\.?|hr\b\.?|hrs\b\.?)" ReplaceBy="h">
    <ERROR UseREOnlyToFind="True" Find="\d(h\b\.?|hs\b\.?|hr\b\.?|hrs\b\.?)" ReplaceBy=" h">

    Usando expresiones regulares para corregir las terminaciones en «ción».
    <ERROR Find="(cion)\b" ReplaceBy="ción">

    Sustituyendo únicamente lo que está entre paréntesis.
    <ERROR UseREOnlyToFind="True" Find="\b(I)le" ReplaceBy="l">

    Buscar extranjerismos sin tener que sustituirlos, solo que nos los marque como posibles errores de OCR para corregirlos manualmente, ej. Folla, follé, follaste, Follado, follar...
    <ERROR Find="\b[Ff]oll([aé]|aste|ado|ar)\b" >

    Punto antes de «¿» y «¡» cuando termina con minúscula antes del signo y empieza con mayúscula después del signo, ej. Hola ¿Cómo estás? ---> Hola. ¿Cómo estás?
    <ERROR UseREOnlyToFind="True" Find="[\wá-ú]( )¿[A-ZÁ-Ú]" ReplaceBy=". ">
    <ERROR UseREOnlyToFind="True" Find="[\wá-ú]( )¡[A-ZÁ-Ú]" ReplaceBy=". ">

    Onomatopeyas: http://regex101.com/r/xH7aJ7
    Spoiler:
    SPOILER:
    <!-- Onomatopeyas -->
    <ERROR UseREOnlyToFind="False" Find="^(?i)([ !?¿¡.,;:—–'\x22\n\r-]|\x3C/?[ibuc]\x3E|\x3Cc:#[0-9a-fA-F]{6}\x3E|a+h+|o+h+|meh|e+h+|hm+|(g|a+r)r+|(a+|o+|e+ )w+|b?p?g?ah+|phe+w+|o+uch|yack|n*h*u+n*h+|r*(u+|a +)r*n*g*h+|r+aa+|(e|h?i*|hi*-)ya+h*|heh*|a*ha+h*|oo+(f|h)|he+y|hyuh|whe+w|s+(s| h)h+|b?zz+t?|mm+|wh?(oo+|a+|o+a+)h?w?|wo+h?w?|bla+ h*|whoo+sh|tsk|oi|mwah+|pff+t*|ps+(h|t)?|um+|ahem| wh?o+-ho+|(wh?)?oo+ps?(ie|y)?|e+u+gh+|y+ee+|bo+m)+$" ReplaceBy="">


    Repeticiones de palabras más de 3 veces: http://regex101.com/r/kE2jG5
    Spoiler:
    SPOILER:
    <ERROR Find="(([a-zá-ú]+)[\.,]?\s[A-ZÁ-Úa-zá-ú]){3,}\1">


    Palabras que empiezan con: http://regex101.com/r/qK1oG1

    Todas las posibles conjugaciones del verbo follar excepto follaje y folleto: http://regex101.com/r/jE0rY7
    Expresión revisada para SW
    Spoiler:
    SPOILER:
    <ERROR Find="(?i)(\bfoll([aeéoó][nsdr]?[^\wáé]))|(\bfoll([eéaá][ibsrdo][\wáé]))|(\bfoll[\wá-ú]{4,10})|(folleta)">


    Ver Script OCR en línea

    Script OCR en español

    Utilicé la versión 6.0b tanto como para la traducción como para el archivo OCR en español, deben meter los archivos a sus carpetas correspondientes.
    Archivos adjuntados Archivos adjuntados
    Última edición por paconaranjo; 18-06-2014 a las 01:27:38

  2. Los siguientes 6 usuarios agradecen el post de paconaranjo:


  3. #2
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 369

    Predeterminado

    La versión final revisada está en la siguiente página:

    http://www.subadictos.net/foros/showthread.php?t=31967

    La anterior contenía muchos errores, bórrenla y sustitúyanla por la nueva.

    Saludos.
    Última edición por paconaranjo; 18-06-2014 a las 01:32:26

  4. #3
    Subtitulador Avatar de kingcreole
    Fecha de ingreso
    09-09-2010
    Ubicación
    Argentina
    Mensajes
    17,333
    Agradecimientos: 1361

    Predeterminado

    A ver Paco, para convertir segunda persona del plural en tercera persona del plural para "latinizar", a ver que te parece. Me gustaría mejorarlo.

    Encontré reglas (espero que sirvan) para Potencial, Pretérito imperfecto del subjuntivo, futuro imperfecto del subjuntivo y futuro imperfecto indicativo. Me gustaría ponerle un /b al final para que sea fin de palabra, pero no me lo toma, si ves como te lo agradecería.

    Por otro lado, para el resto de los tiempos, necesito conjugar a mano, por ahora trato de cubrir esta lista de verbos mas comunes en inglés (sólo hice algunos), despues hay de 100 y también de 300, pero primero quiero ver a ver si no encontramos más reglas, hay algunas que se reemplazan por dos opciones.

    Después los voy a meter en mis super OCR, en el que va directo los reemplazos directos y en el condicional, los que dependen de fórmulas.

    Abrazo, gracias!!

    (se nota que no estoy demasiado entusiasmado con el futbol, jeje)
    Archivos adjuntados Archivos adjuntados
    Última edición por kingcreole; 09-07-2014 a las 22:37:09
    "Bienaventurados los que dan sin recordar, y los que reciben sin olvidar". Madre Teresa de Calcuta

    There are two kinds of music. Rock and Roll.

  5. #4
    Subtitulador Avatar de Wendy
    Fecha de ingreso
    29-05-2010
    Mensajes
    18,789
    Agradecimientos: 12969

    Predeterminado

    ¿Se puede crear una línea de código que le indique que no corte las líneas después de palabras como que, el, la, los, a, etc.?

    Ejemplo:
    No se dio cuenta que corría hacia el
    árbol hasta que fue demasiado tarde.


    Y que lo marque para poder encontrarlo sin tener que parar el video cada 2 segundos para corrregirlo.
    No se dio cuenta que corría hacia el árbol
    hasta que fue demasiado tarde.



    Es para facilitar la fluidez de la lectura, son segundos preciosos en que el cerebro no tiene que usarlos en pensar qué viene después del articulo sino en leer el resto de la línea.

    Sería fabuloso que lo corrigiera solo, pero sin saber nada del código sospecho que no es posible.
    Última edición por Wendy; 07-07-2015 a las 17:27:51
    Escribir bien no cuesta nada y reporta un beneficio de la...
    //···- Nolite te bastardes carborundorum -···//

  6. #5
    Adicto Avatar de acerswap
    Fecha de ingreso
    20-03-2013
    Ubicación
    Madrid
    Edad
    38
    Mensajes
    239
    Agradecimientos: 127


    Seguir a acerswap en Twitter

    Predeterminado

    Si que es posible. Lamentablemente no se casi nada de regex, pero si que lo es.

    Ayudandome de la wikipedia y de los ejemplos que hay por aqui, creo que para que se pase el artículo "el" a la linea siguiente sería
    <ERROR UseREOnlyToFind="True" Find="el$" Replace="$el">

    Alargaría la linea inferior, pero mantendría la estructura correcta. Alguno de los expertos podrá adaptarlo para que se suba la siguiente palabra o se baje el artículo según si la linea superior es mas larga o mas corta que la inferior.
    Jumping, jumping, everybody...
    --Crayon pop (Bar bar bar)

  7. #6
    Adicto Avatar de acerswap
    Fecha de ingreso
    20-03-2013
    Ubicación
    Madrid
    Edad
    38
    Mensajes
    239
    Agradecimientos: 127


    Seguir a acerswap en Twitter

    Predeterminado

    Si que es posible. Lamentablemente no se casi nada de regex, pero si que lo es.

    Ayudandome de la wikipedia y de los ejemplos que hay por aqui, creo que para que se pase el artículo "el" a la linea siguiente sería
    <ERROR UseREOnlyToFind="True" Find="el$" Replace="$el">

    Alargaría la linea inferior, pero mantendría la estructura correcta. Alguno de los expertos podrá adaptarlo para que se suba la siguiente palabra o se baje el artículo según si la linea superior es mas larga o mas corta que la inferior.

  8. #7
    Subtitulador Avatar de Wendy
    Fecha de ingreso
    29-05-2010
    Mensajes
    18,789
    Agradecimientos: 12969

    Predeterminado

    Cita Iniciado por acerswap Ver mensaje
    Si que es posible. Lamentablemente no se casi nada de regex, pero si que lo es.

    Ayudandome de la wikipedia y de los ejemplos que hay por aqui, creo que para que se pase el artículo "el" a la linea siguiente sería
    <ERROR UseREOnlyToFind="True" Find="el$" Replace="$el">

    Alargaría la linea inferior, pero mantendría la estructura correcta. Alguno de los expertos podrá adaptarlo para que se suba la siguiente palabra o se baje el artículo según si la linea superior es mas larga o mas corta que la inferior.
    ¡Buenísimo! Gracias, acerswap.
    ¿El signo de $ viene a reemplazar el Enter? Así solamente tendría que reemplazar el artículo por las otras palabras e iría cubriendo, por lo menos, varios casos. Ya el el SW marca cuando la línea sobrepasa determinada cantidad de líneas, pero si pudiera automatizar eso también sería excelente.
    Ayer pude solucionar un problema repetido gracias a este tutorial; ponerle la mayúscula a Ud./Uds. Todo un logro porque esto del código es un idioma extraterrestre para mí. Ahora estoy tratando de averiguar como reemplazar ".." por uno solo.
    Última edición por Wendy; 08-07-2015 a las 13:48:40

  9. #8
    Subtitulador Avatar de Wendy
    Fecha de ingreso
    29-05-2010
    Mensajes
    18,789
    Agradecimientos: 12969

    Predeterminado

    Actualización: No me lo tomó.

  10. #9
    Adicto Avatar de acerswap
    Fecha de ingreso
    20-03-2013
    Ubicación
    Madrid
    Edad
    38
    Mensajes
    239
    Agradecimientos: 127


    Seguir a acerswap en Twitter

    Predeterminado

    Acabo de ver un error que he cometido tambien (aparte del simbolo): me he saltado un espacio. Deberia haber puesto " el$" y no "el$". Con lo que habia puesto saldrian fallos como este:

    Antes:
    Me fui a casa de Rafael
    a pasar la noche.

    Despues:
    Me fui a casa de Rafa
    el a pasar la noche.

    Edit: prueba con \r o \n en vez de $.
    Última edición por acerswap; 08-07-2015 a las 14:03:17

  11. #10
    Subtitulador Avatar de Wendy
    Fecha de ingreso
    29-05-2010
    Mensajes
    18,789
    Agradecimientos: 12969

    Predeterminado

    Probé varias opciones, lo mío es muy científico: prueba y error

    Con esta no lo toma como error
    <ERROR UseREOnlyToFind="True" Find=" el\n" Replace="\nel">

    Con esta línea me los marcó. El más efectivo hasta ahora.
    <ERROR UseREOnlyToFind="True" Find=" el\r" Replace="\rel">

    Con esta, lo marca, borra el artículo y sube toda la línea
    <ERROR UseREOnlyToFind="True" Find=" el\r" ReplaceBy="\rel">
    <ERROR UseREOnlyToFind="True" Find=" el\r" ReplaceBy="r\el">


    De encontrar la solución para que lo baje automáticamente, también serviría para los diálogos que están de corrido:
    - ¿Encontraste lo que te dejé sobre la mesa? - Si,
    estaba muy rico. Gracias.
    Última edición por Wendy; 08-07-2015 a las 14:45:58

  12. #11
    Adicto Avatar de acerswap
    Fecha de ingreso
    20-03-2013
    Ubicación
    Madrid
    Edad
    38
    Mensajes
    239
    Agradecimientos: 127


    Seguir a acerswap en Twitter

    Predeterminado

    Prueba con esta (agregando WholeWord):

    <ERROR UserREOnlyToFind="True" WholeWord="True" Find=" el\_r" ReplaceBy="\rel">
    Última edición por acerswap; 08-07-2015 a las 15:30:18

  13. #12
    Subtitulador Avatar de Wendy
    Fecha de ingreso
    29-05-2010
    Mensajes
    18,789
    Agradecimientos: 12969

    Predeterminado

    No funcionó. Probé moviendo el guión bajo a otras posiciones, incluso en la parte de ReplaceBy, e ignora la parte del reemplazo o borra el artículo y pega las palabras anterior y posterior al artículo.

    Esta parte funciona bien, porque lo encuentra.
    <ERROR UseREOnlyToFind="True" Find=" el\r"

    Lo que se complica es la parte del reemplazo para que no borre la palabra sino que le ponga el enter antes.

    ¿Qué función cumple el guión? Intenté buscar un "dicionario" de código Pascal, pero no lo encontre, ni siquiera estoy segura de que sea el lenguaje correcto, a decir verdad. Y los tutoriales que encontré asumen que ya tenés un conocimiento base de programación.

  14. #13
    Adicto Avatar de acerswap
    Fecha de ingreso
    20-03-2013
    Ubicación
    Madrid
    Edad
    38
    Mensajes
    239
    Agradecimientos: 127


    Seguir a acerswap en Twitter

    Predeterminado

    Esto no es Pascal. De todos modos prueba a usar un programa como notepad++ a ver si tienes alguna opcion que te lo facilite.

  15. #14
    Subtitulador Avatar de Wendy
    Fecha de ingreso
    29-05-2010
    Mensajes
    18,789
    Agradecimientos: 12969

    Predeterminado

    Ok. ¿Pero como uso un editor de código si no conozco el código? ¿No es como tratar de escribir en el Word en un idioma que no se conoce?

    ¿Alguien le puede avisar a Paconaranjo que necesito de su sapiencia?

  16. #15
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 369

    Predeterminado

    Veo que me necesito suscribir a este tema también.

    Saludos.

    ------------------------------------------------------

    Aquí está funcionando.

    http://regexr.com/3bd8c

    Nada más falta implementarlo en SW. Si puedes probarlo, es que ahorita no puedo instalar el SW. El que tenía no me funciona, llevo días con la computadora fallando.

    <ERROR UseREOnlyToFind="False" Find="\sel\n(.)" ReplaceBy="\rel $1">

    Me avisas.

    PD: Si te funciona se pueden agregar más variables sin que tengas que hacer más líneas de código. Por ejemplo:

    http://regexr.com/3bd8f

    <ERROR UseREOnlyToFind="False" Find="\s(lo|el|la|los|que)\n(.)" ReplaceBy="\r$1 $2">
    Última edición por paconaranjo; 15-07-2015 a las 23:09:18

  17. #16
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 369

    Predeterminado

    Cita Iniciado por kingcreole Ver mensaje
    A ver Paco, para convertir segunda persona del plural en tercera persona del plural para "latinizar", a ver que te parece. Me gustaría mejorarlo.

    Encontré reglas (espero que sirvan) para Potencial, Pretérito imperfecto del subjuntivo, futuro imperfecto del subjuntivo y futuro imperfecto indicativo. Me gustaría ponerle un /b al final para que sea fin de palabra, pero no me lo toma, si ves como te lo agradecería.

    Por otro lado, para el resto de los tiempos, necesito conjugar a mano, por ahora trato de cubrir esta lista de verbos mas comunes en inglés (sólo hice algunos), despues hay de 100 y también de 300, pero primero quiero ver a ver si no encontramos más reglas, hay algunas que se reemplazan por dos opciones.

    Después los voy a meter en mis super OCR, en el que va directo los reemplazos directos y en el condicional, los que dependen de fórmulas.

    Abrazo, gracias!!

    (se nota que no estoy demasiado entusiasmado con el futbol, jeje)
    Disculpa mi ausencia, a este tema no estaba suscrito. Pero si todavia tienes dudas me dices y te ayudo a resolverlo.

    Yo este tipo de cosas las limpio con el subtitle edit y el diccionario modificado para que todas esas palabras me las vaya revisando el corrector ortográfico.
    Última edición por paconaranjo; 15-07-2015 a las 23:17:06

  18. #17
    Subtitulador Avatar de terecid
    Fecha de ingreso
    31-03-2012
    Ubicación
    GIJON. Asturias
    Mensajes
    2,533
    Agradecimientos: 1245


    Agrega a terecid en Facebook

    Predeterminado

    Yo uso el notepack y me va muy bien.

Información de tema

Usuarios viendo este tema

Actualmente hay 1 usuarios viendo este tema. (0 miembros y 1 visitantes)

Temas similares

  1. TUTORIAL: sincronizar subtítulos con el Subtitle Workshop
    Por pepe2982 en el foro Tutoriales Para Programas de Subtítulos
    Respuestas: 31
    Último mensaje: 04-02-2015, 17:40:31
  2. TUTORIAL: Descargar y Configurar Subtitle Workshop 2.51
    Por japezoa en el foro Tutoriales Para Programas de Subtítulos
    Respuestas: 3
    Último mensaje: 24-02-2013, 19:57:25

Miembros que han leído este tema: 5

Permisos de publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •