Resultados 1 al 13 de 13

Tema: GUÍA: Subtitle Edit Expresiones Regulares

  1. #1
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    México GUÍA: Subtitle Edit Expresiones Regulares



    Prueba tus propias expresiones

    Página oficial para hacer pruebas: http://www.regexr.com/

    Traducción propia en fase beta al español: http://regexr.atspace.eu/

    Descargar aplicación para Windows, Linux y Mac OSX: http://ideas-y-proyectos.blogspot.mx...n-espanol.html


    Presentación

    Hola a todos. Me gustaría que entre todos hiciéramos una lista con los errores más comunes a la hora de corregir un subtítulo, de esta forma puedo crear unas expresiones regulares que corrijan todos estos errores y poder usarlas con el Subtitle Edit y Subtitle Workshop.

    Aquí voy a ir poniendo todos los errores que se corrigen actualmente y cuál es su expresión, así todos pueden colaborar. Los ejemplos mencionados más abajo están basados en el Subtitle Edit; mi programa favorito.

    ADVERTENCIA: Si piensan usar los diccionarios que voy a estar adjuntando en este tema, no vayan a aplicar los cambios que haga hasta corroborar que la corrección es la correcta, en caso contrario pueden desactivar la casilla para que no corrija dicha línea y reportarme el error para que pueda corregirlo.

    DESARGAR

    Spoiler:
    SPOILER:
    Versión final del Subtitle Edit 3.3.7 con una actualización de la traducción completa y una pequeña revisión del archivo OCR en español (falta pulirlo):

    http://www.mediafire.com/#n8pf4gd21g494

    Espero les guste.


    EXPRESIONES REGULARES

    Miscelánea

    Spoiler:
    SPOILER:
    <RegEx find="(\b[Cc]erca|\b[Ee]ncima|\b[Dd]ebajo|\b[Dd]etrás|\b[Dd]elante)(\s)mío" replaceWith="$1 de mí" />
    <RegEx find="(\b[Cc]erca|\b[Ee]ncima|\b[Dd]ebajo|\b[Dd]etrás|\b[Dd]elante)(\s)tuyo" replaceWith="$1 de ti" />

    Detrás mío. --> Detrás de mí.


    Prefijos; palabras compuestas.

    Spoiler:
    SPOILER:
    <!-- Prefijos; palabras compuestas (simple) -->
    <RegEx find="(\b[Ee]x|\b[Ss]uper|\b[Aa]nti|\b[Pp]os|\b[Pp]re|\b[Pp]ro|\b[Vv]ice)[\s\x2D]([a-z]{3,20})(\b)" replaceWith="$1$2" />

    Mi vida es super interesante. --> Mi vida es superinteresante.
    Eres super-genial. --> Eres supergenial.


    <!-- Prefijos; palabras compuestas (números) -->
    <RegEx find="(\b[Ss]ub|\b[Ss]uper)[\s\x2D](\d{2})(\b)" replaceWith="$1-$2$3" />

    Pertenece a la sub 21 --> Pertenece a la sub-21

    <!-- Prefijos; palabras compuestas (mayúsculas) -->
    <RegEx find="(\b[Aa]nti|\b[Mm]ini|\b[Pp]os|\b[Pp]ro)\s([A-Z]{2,10}){0,1}([A-Z][a-z]{1,10}){0,1}(\b)" replaceWith="$1-$2$3" />

    anti Obama --> anti-Obama
    anti CIA --> anti-CIA
    mini USB --> mini-USB



    Signos invertidos.

    Spoiler:
    SPOILER:
    Con estas líneas se resuelven los signos de interrogación invertidos de la siguiente forma.
    <RegEx find="\?¿¿" replaceWith="? ¿" />
    <RegEx find="\!¡¡" replaceWith="! ¡" />

    Corregido de esta forma
    ¿Vendras?¿¿Con quien? --> ¿Vendrás? ¿Con quién?
    ¡No!¡¡No! --> ¡No! ¡No!

    Con estas líneas se resuelven los signos de interrogación invertidos de la siguiente forma.
    <RegEx find="\?¿" replaceWith="? ¿" />
    <RegEx find="\!¡" replaceWith="! ¡" />

    Corregido de esta forma
    ¿Vendras?¿Con quien? --> ¿Vendrás? ¿Con quién?
    ¡No!¡No! --> ¡No! ¡No!



    Uso de las comillas latinas/españolas: «\x22» para ANSI y «\u0022» para Unicode equivale a las comillas dobles «"».

    Spoiler:
    SPOILER:
    <RegEx find="x22$" replaceWith="«" />
    <RegEx find="u0022" replaceWith="«" />
    <RegEx find="[`´]" replaceWith="'" />
    <RegEx find="(\.)»" replaceWith="»." />
    <RegEx find="«(\?)" replaceWith="»?" />
    <RegEx find="«(\!)" replaceWith="»!" />
    <RegEx find="«( )" replaceWith="» " />
    <RegEx find="(\.)«" replaceWith="»." />
    <RegEx find="«(\))" replaceWith="»)" />
    <RegEx find="(\?)«" replaceWith="?»" />
    <RegEx find="(\!)«" replaceWith="!»" />
    <RegEx find="«(,)" replaceWith="»," />
    <RegEx find="«(" replaceWith="»;" />
    <RegEx find="«(" replaceWith="»:" />
    <RegEx find="«(\?)" replaceWith="»?" />
    <RegEx find="«(\!)" replaceWith="»!" />
    <RegEx find="(¿)»" replaceWith="¿«" />
    <RegEx find="(¡)»" replaceWith="¡«" />
    ...

    Original
    "¡La vida no es como la pintan!"
    "¿Y ese `chistocito´ que se creé?"

    Corregido
    «¡La vida no es como la pintan!»
    «¿Y ese 'chistocito' que se creé?»



    Puntos y comas innecesarios que no detectaba el programa (varios casos).

    Spoiler:
    SPOILER:
    <RegEx find="(\.\.\.+)$" replaceWith="..." />
    Me estaba..... --> Me estaba...
    <RegEx find="(\w)(\.\.)$" replaceWith="$1." />
    <RegEx find="(\w)\.\.(\s)" replaceWith="$1.$2" />
    Está bien.. Me voy a ocupar de eso.. --> Está bien. Me voy a ocupar de eso.
    <RegEx find="(, ,+)$" replaceWith="," />
    <RegEx find="(,\s),+\s" replaceWith="$1"
    Me estaba preguntando,, como sería,,, --> Me estaba preguntando, como sería,
    <RegEx find="\.([\?\!])" replaceWith="$1" />
    <RegEx find="([\:\;])\." replaceWith="$1" />
    <RegEx find="\.([\:\;])" replaceWith="$1" />
    ¿Quién te lo dijo.? --> ¿Quién te lo dijo?
    El dijo.: --> El dijo:
    Si bien recuerdo;. --> Si bien recuerdo;



    Numeración.

    Spoiler:
    SPOILER:
    <RegEx find="([0-9])\.([0-9])\b" replaceWith="$1,$2" />
    1.0 --> 1,0
    <RegEx find="(\d)\.(\d\d)\b" replaceWith="$1,$2" />
    1.00 --> 1,00
    <RegEx find="([0-9])[,\.]([0-9]{3})\b" replaceWith="$1$2" />
    1,000. 1.000. --> 1000. 1000.
    <RegEx find="(\d) ([:;])" replaceWith="$1$2" />
    1000 : --> 1000:



    Signos musicales (opcional).

    Spoiler:
    SPOILER:
    <RegEx find="[♪♫☺☹♥©☮☯Σ∞≡⇒π#](\r\n)[♪♫☺☹♥©☮☯Σ∞≡⇒π#]" replaceWith="$1" />

    Original
    ♪ So if you feel me ♪
    ♪ let me know, know, know ♪

    Corregido
    ♪ So if you feel me
    let me know, know, know ♪



    Corrige los errores en el ripeo de la «o» mayúscula por el cero «0» y viceversa.

    Spoiler:
    SPOILER:
    <RegEx find="(\d)O" replaceWith="$1 0" />
    10O --> 100
    <RegEx find="(\d)[,\.]O" replaceWith="$1.0" />
    1.O --> 1.0
    1,O --> 1,0
    <RegEx find="([A-Z])0" replaceWith="$1O" />
    MAN0 --> MANO
    <RegEx find="\b0([A-Za-z])" replaceWith="O$1" />
    0so --> Oso



    Errores de ripeo donde la «i» se pone como «l».

    Spoiler:
    SPOILER:
    <RegEx find="([BbCcDdFfHhMmNnRrSsTtVv])l([bcdhmnrstv])" replaceWith="$1i$2" />
    Dlce que no quiere blberón. No quiere comlda. --> Dice que no quiere biberón. No quiere comida.
    <RegEx find="([Rr]ac)l(o)" replaceWith="$1i$2" />
    <RegEx find="([Oo]pc)l(o)" replaceWith="$1i$2" />
    Oraclones opclonales. No seas gracloso. --> Oraciones opcionales. No seas gracioso.
    <RegEx find="\b([Ss])(l)\b" replaceWith="$1i" />
    Sl no. Pero sl no pasa nada. --> Pero si no pasa nada. Si no.



    Terminaciones con ción/sión.

    Spoiler:
    SPOILER:
    <RegEx find="([sc]i)o(n)\b" replaceWith="$1ó$2" />
    <RegEx find="([SC]I)O(N)\b" replaceWith="$1Ó$2" />

    Mi cancion es muy buena. --> Mi canción es muy buena.
    EDUCACION SUPERIOR --> EDUCACIÓN SUPERIOR
    La pasion de Cristo. --> La pasión de Cristo.
    PROPULSION --> PROPULSIÓN
    Cerrada la sesión. --> Cerrada la sesión.



    Abreviaturas.

    Spoiler:
    SPOILER:
    Expresiones regulares

    <RegEx find="(\s)seg" replaceWith="$1s" />
    <RegEx find="(\d)seg" replaceWith="$1 s" />
    <RegEx find="(\s)sg" replaceWith="$1s" />
    <RegEx find="(\d)sg" replaceWith="$1 s" />
    <RegEx find="(\s)s" replaceWith="$1s" />
    <RegEx find="(\d)s" replaceWith="$1 s" />
    <RegEx find="(\s)s.(\r)" replaceWith="$1s.$2" />
    <RegEx find="(\d)s.(\r)" replaceWith="$1 s.$2" />
    <RegEx find="(\s)s.(\s)" replaceWith="$1s$2" />
    <RegEx find="(\d)s.(\s)" replaceWith="$1 s$2" />
    Te dije 10seg y lo hiciste en 15sg. --> Te dije 10 s y lo hiciste en 15 s.
    <RegEx find="(\d)AM" replaceWith="$1 a. m." />
    <RegEx find="(\s)AM" replaceWith="$1a. m." />
    <RegEx find="(\d)am" replaceWith="$1 a. m." />
    <RegEx find="(\s)am" replaceWith="$1a. m." />
    <RegEx find="(\d)(a\.)(m\.)" replaceWith="$1 $2 $3" />
    <RegEx find="(\s)(a\.)(m\.)" replaceWith="$1$2 $3" />
    <RegEx find="(\d)am(\.)" replaceWith="$1 a. m." />
    <RegEx find="(\s)am(\.)" replaceWith="$1a. m." />
    <RegEx find="(\d)PM" replaceWith="$1 p. m." />
    <RegEx find="(\s)PM" replaceWith="$1p. m." />
    <RegEx find="(\d)pm" replaceWith="$1 p. m." />
    <RegEx find="(\s)pm" replaceWith="$1p. m." />
    <RegEx find="(\d)pm(\.)" replaceWith="$1 p. m." />
    <RegEx find="(\s)pm(\.)" replaceWith="$1p. m." />
    <RegEx find="(\d)(p\.)(m\.)" replaceWith="$1 $2 $3" />
    <RegEx find="(\s)(p\.)(m\.)" replaceWith="$1$2 $3" />
    Me levanté a las 4am y acosté a las 10pm. --> Me levanté a las 4 a. m. y acosté a las 10 p. m.



    Casos con «sé»

    Spoiler:
    SPOILER:
    <RegEx find="(\b[Ll]o|\b[Ll]a|\b[Ll]e)(\s)se" replaceWith="$1$2sé" />
    <RegEx find="[Ss]e\s(dónde\b|cuándo\b|adónde\b|cómo\b|cuál\b|quién\ b|cuánto\b|cuánta\b|cuántos\b|cuántas\b|cuán\b)" replaceWith="sé $1" />


    Casos con «té»

    Spoiler:
    SPOILER:
    <RegEx find="\b([Tt])e\s(verde\b|negro\b|perla\b|de\b)" replaceWith="$1é $2" />

    Te verde, te de tila, te negro. --> Té verde, té de tila, té negro.


    Casos con «sí»

    Spoiler:
    SPOILER:
    <RegEx find="\b([Ss])i(:|;|,|\.)" replaceWith="$1í$2" />


    Vocativos (Se pueden añadir más casos; para esto necesito de su ayuda con muchos ejemplos)

    Spoiler:
    SPOILER:
    <RegEx find="(\b[A-Z][a-zá-ú]{3,12})\s(\bte\b|\bantes\b|¿|\bten\b|\bun\b|\bveng an\b|\bapoya\b|\bquiero\b|\bhijo\b)" replaceWith="$1, $2" />

    Original:
    Sebastián te he dicho que vengas.
    Carolina ¿cómo estás?
    Señor ¿me puede decir la hora?
    Lucía ten cuidado
    Mozo un helado.
    Niños vengan pronto a casa.
    Patricia apoya a tus hermanos.
    Mamá quiero chorizo.
    ¡Adios hijo!

    Corregido:
    Sebastián, te he dicho que vengas.
    Carolina, ¿cómo estás?
    Señor, ¿me puede decir la hora?
    Lucía, ten cuidado
    Mozo, un helado.
    Niños, vengan pronto a casa.
    Patricia, apoya a tus hermanos.
    Mamá, quiero chorizo.
    ¡Adios, hijo!

    <RegEx find="(\bHola|\bBueno|\bBien|\bVen|\bVen acá|\besto|\bBuenos días|\bFeliz cumpleaños|\bsiento)\s([A-Z][a-zá-ú]{3,12}\b|señorita\b|señor\b|hijo mío\b|amigo\b)" replaceWith="$1, $2" />

    Original:
    Hola Alfonso.
    Buenos días Rosalía.
    Feliz cumpleaños Marta.
    Lo siento señorita.
    Ven acá Jessie, antes de que me moleste
    Bueno hijo mío, no tenía ganas
    Bien señor.
    Quiero esto amigo.

    Corregido:
    Hola, Alfonso.
    Buenos días, Rosalía.
    Feliz cumpleaños, Marta.
    Lo siento, señorita.
    Ven acá, Jessie, antes de que me moleste
    Bueno, hijo mío, no tenía ganas
    Bien, señor.
    Quiero esto, amigo.


    Uso correcto de la coma

    Spoiler:
    SPOILER:
    3.3. No se escribe coma detrás de pero cuando precede a una oración interrogativa o exclamativa: Pero ¿dónde vas a estas horas?; Pero ¡qué barbaridad!


    <RegEx find="(\b[Pp]ero),(\s)([¡¿])" replaceWith="$1$2$3" />

    Pero, ¿qué me dices? --> Pero ¿qué me dices?

    <RegEx find="(\b[Aa]unque|\b[Aa]sí que),(\s|$)" replaceWith="$1$2" />

    Original:
    Tu trabajo no está completo, así que, es mejor que lo repitas.
    Aunque, había estudiado, no aprobé el examen.

    Corregido:
    Tu trabajo no está completo, así que es mejor que lo repitas.
    Aunque había estudiado, no aprobé el examen.


    <RegEx find="([\w])\s(excepto\b|salvo\b|menos\b)" replaceWith="$1, $2" />

    Original:
    El descuento será aplicable en cualquier tarifa excepto en las de grupos.
    Estoy disponible todos los días salvo el último jueves del mes.
    Puedes hacer con ello lo que quieras, menos regalarlo.

    Corregido:
    El descuento será aplicable en cualquier tarifa, excepto en las de grupos.
    Estoy disponible todos los días, salvo el último jueves del mes.
    Puedes hacer con ello lo que quieras, menos regalarlo.


    Casos donde no debe llevar acento «aun»

    Spoiler:
    SPOILER:
    <RegEx find="(\bni){0,1}(\s){0,1}(\b[Aa])ú(n)(\s){0,1}(así\b|cuando\b|los\b|las\b|negar(te |se)\b){0,1}" replaceWith="$1$2$3u$4$5$6" />

    Aún así, ni aún, aún cuando y aún negarse. --> Aun así, ni aun, aun cuando y aun negarse


    Apóstrofo

    Spoiler:
    SPOILER:
    <RegEx find="(\b[A-Z][a-zá-ú]{3,12})\s(’|')(\d\d(\s|$))" replaceWith="$1 $3" />
    <RegEx find="(\b[A-Z]{2,5})(’|')(s)" replaceWith="(Ej. deubedés)$1$3" />
    <RegEx find="(\b\d{1,2})(’|')(\d{2})\s(s|m)(\W|$)" replaceWith="$1,$3 $4$5" />
    <RegEx find="(\b\d{1,2})(’|')(\d{2})\s(h)(\W|$)" replaceWith="$1:$3 $4$5" />


    En construcción... Próximamente voy a ir poniendo todos los ejemplos de corrección posibles.

    NOTA: Adjunto los diccionarios para el Subtitle Edit 3.3.7, estas expresiones se pueden agregar al Subtitle Workshop con su debido formato.

    PD: Arreglado unos errores con las expresiones regulares donde borraba palabras que empezaban con seg, se, etc. Por favor, avísenme de todos los errores que vayan viendo para corregirlos.
    Última edición por paconaranjo; 10-05-2014 a las 04:07:00

  2. Los siguentes 5 usuarios agradecen el post de paconaranjo:


  3. #2
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    Cita Iniciado por jarzepol
    Te iba a responder en el hilo, pero me pareció mejor hacerlo por mensaje privado.

    Qué bien está esto, paconaranjo. Te tengo unas sugerencias, aunque tal vez ya las habías considerado.

    1ra. En la parte de numeración, tercera expresión regular, deberías cambiar "1,000" por "1000". Sin el punto como separación de los miles.
    Corrección de la expresión regular para la numeración de 2 y 4 dígitos.


    Spoiler:
    SPOILER:

    http://www.rae.es/dpd/srv/search?id=QHaq7I8KrD6FQAyXTS

    a) Al escribir números de más de cuatro cifras, se agruparán estas de tres en tres, empezando por la derecha, y separando los grupos por espacios en blanco: 8 327 451 (y no por puntos o comas, como, dependiendo de las zonas, se hacía hasta ahora: 8.327.451; 8,327,451). Los números de cuatro cifras se escriben sin espacios de separación: 2458 (no 2 458). En ningún caso deben repartirse en líneas diferentes las cifras que componen un número: 8 327 / 451.

    <!-- Numeración -->
    <RegEx find="([0-9])\.([0-9])\b" replaceWith="$1,$2" />
    <RegEx find="([0-9])[,\.]([0-9]{3})\b" replaceWith="$1$2" />

    1.2 --> 1,2
    1,000 --> 1000
    1.000 --> 1000


    2da. Agregar el caso de la mayúscula luego de los dos puntos, pero creo que va a ser un poco difícil pues depende de quién lo escribió. En la mayoría de los casos no va mayúscula luego de lo dos puntos. Según el DPD, los casos en que va mayúscula luego de los dos puntos son los siguientes.

    - Preceden a la reproducción de citas o palabras textuales, que deben escribirse entre comillas e iniciarse con mayúscula (→ mayúsculas, 3.3c): Ya lo dijo Ortega y Gasset: «La claridad es la cortesía del filósofo». [Observa el uso de las itálicas como comillas, por eso la mayúscula en el ejemplo]

    - Se emplean tras las fórmulas de saludo en el encabezamiento de cartas y documentos. En este caso, la palabra que sigue a los dos puntos, y que inicia el cuerpo de la carta, se escribe con inicial mayúscula y en renglón aparte (→ mayúsculas, 3.3a): Muy señor mío: / Le agradeceré que en el plazo más breve posible... Es costumbre anglosajona, que debe evitarse en español, utilizar la coma en lugar de los dos puntos: Querido amigo, / Te escribo esta carta para comunicarte...

    - En textos jurídicos y administrativos, como decretos, sentencias, bandos, edictos, certificados o instancias, se colocan después del verbo que presenta el objetivo fundamental del documento y que va escrito con todas sus letras en mayúscula (→ mayúsculas, 2.2d). La primera palabra que sigue a dicho verbo se escribe con inicial mayúscula y en párrafo aparte (→ mayúsculas, 3.3b): CERTIFICA: / Que D. José Álvarez García ha seguido con aprovechamiento el Curso... Solamente en este caso los dos puntos son compatibles con la conjunción subordinante que.

    Si quieres ver los demás casos, aquellos donde no va seguido de mayúscula, haz clic aquí.
    Casos de mayúsculas con dos puntos

    Spoiler:
    SPOILER:

    Caso 1

    <RegEx find="([a-z]): «([a-z])" replaceWith="$1: «(Mayúscula)$2" />
    Ya lo dijo Ortega y Gasset: «la claridad es la cortesía». --> Ya lo dijo Ortega y Gasset: «(Mayúscula)la claridad es la cortesía».

    Caso 2 pendiente

    Caso 3
    <RegEx find="([A-Z]): ([a-z])" replaceWith="$1: (Mayúscula)$2" />
    CERTIFICA: que José Álvarez... --> CERTIFICA: (Mayúscula)que José Álvarez...

    Las siguientes son aún más difíciles de corregir de esta manera, pero te las digo igual por si acaso encuentras una manera de hacerlo.

    3ra. Colocar las comas vocativas: Hola, jarzepol; Ven acá, Jessie, antes de que me moleste; La verdad es que, hijo mío, no tenía ganas; etc.
    Vocativos (Se pueden añadir más casos; para esto necesito de su ayuda con muchos ejemplos)

    Spoiler:
    SPOILER:
    <RegEx find="(\b[A-Z][a-zá-ú]{3,12})\s(\bte\b|\bantes\b|¿|\bten\b|\bun\b|\bveng an\b|\bapoya\b|\bquiero\b|\bhijo\b)" replaceWith="$1, $2" />

    Original:
    Sebastián te he dicho que vengas.
    Carolina ¿cómo estás?
    Señor ¿me puede decir la hora?
    Lucía ten cuidado
    Mozo un helado.
    Niños vengan pronto a casa.
    Patricia apoya a tus hermanos.
    Mamá quiero chorizo.
    ¡Adios hijo!

    Corregido:
    Sebastián, te he dicho que vengas.
    Carolina, ¿cómo estás?
    Señor, ¿me puede decir la hora?
    Lucía, ten cuidado
    Mozo, un helado.
    Niños, vengan pronto a casa.
    Patricia, apoya a tus hermanos.
    Mamá, quiero chorizo.
    ¡Adios, hijo!

    <RegEx find="(\bHola|\bBueno|\bBien|\bVen|\bVen acá|\besto|\bBuenos días|\bFeliz cumpleaños|\bsiento)\s([A-Z][a-zá-ú]{3,12}\b|señorita\b|señor\b|hijo mío\b|amigo\b)" replaceWith="$1, $2" />

    Original:
    Hola Alfonso.
    Buenos días Rosalía.
    Feliz cumpleaños Marta.
    Lo siento señorita.
    Ven acá Jessie, antes de que me moleste
    Bueno hijo mío, no tenía ganas
    Bien señor.
    Quiero esto amigo.

    Corregido:
    Hola, Alfonso.
    Buenos días, Rosalía.
    Feliz cumpleaños, Marta.
    Lo siento, señorita.
    Ven acá, Jessie, antes de que me moleste
    Bueno, hijo mío, no tenía ganas
    Bien, señor.
    Quiero esto, amigo.


    4ta. Eliminar las comas incorrectas en frases como estas: La verdad es que, no tenía ganas; El problema es que, ya se fueron; etc.
    Uso correcto de la coma

    Spoiler:
    SPOILER:
    3.3. No se escribe coma detrás de pero cuando precede a una oración interrogativa o exclamativa: Pero ¿dónde vas a estas horas?; Pero ¡qué barbaridad!


    <RegEx find="(\b[Pp]ero),(\s)([¡¿])" replaceWith="$1$2$3" />

    Pero, ¿qué me dices? --> Pero ¿qué me dices?

    <RegEx find="(\b[Aa]unque|\b[Aa]sí que),(\s|$)" replaceWith="$1$2" />

    Original:
    Tu trabajo no está completo, así que, es mejor que lo repitas.
    Aunque, había estudiado, no aprobé el examen.

    Corregido:
    Tu trabajo no está completo, así que es mejor que lo repitas.
    Aunque había estudiado, no aprobé el examen.


    <RegEx find="([\w])\s(excepto\b|salvo\b|menos\b)" replaceWith="$1, $2" />

    Original:
    El descuento será aplicable en cualquier tarifa excepto en las de grupos.
    Estoy disponible todos los días salvo el último jueves del mes.
    Puedes hacer con ello lo que quieras, menos regalarlo.

    Corregido:
    El descuento será aplicable en cualquier tarifa, excepto en las de grupos.
    Estoy disponible todos los días, salvo el último jueves del mes.
    Puedes hacer con ello lo que quieras, menos regalarlo.



    5to. Eliminar las tildes de los "aún" cuando son sinónimos de "incluso" o "hasta": Aun así, vine de inmediato; Aun cuando se hizo así, no resultó; etc.

    Gracias por el esfuerzo.
    Casos donde no debe llevar acento «aun»

    Spoiler:
    SPOILER:
    <RegEx find="(\bni){0,1}(\s){0,1}(\b[Aa])ú(n)(\s){0,1}(así\b|cuando\b|los\b|las\b|negar(te |se)\b){0,1}" replaceWith="$1$2$3u$4$5$6" />

    Aún así, ni aún, aún cuando y aún negarse. --> Aun así, ni aun, aun cuando y aun negarse

    __________________________________________________
    Si te parece bien voy a poner tu mensaje en el tema y poco a poco voy poniendo solución donde la haya. Pero por lo que he visto hasta ahora, podemos corregir varios casos, a lo mejor no todos pero si la mayoría, nada más es cosa de buscar un patrón de comportamiento que siempre se repita.

    Ejemplo:

    En|sé|Y [por qué|cuándo|dónde|adónde|cómo|cuál|quién|qué|cómo|c uánto(s)|cuánta(s)]

    En lo que me he fijado es que cuando le antecede «sé» e «y» se acentúan, por lo menos eso creo.

    Sé qué hizo y dónde lo hizo.
    Sé adónde fue y cuánto tiempo tardó.
    Sé cuál de los dos lo mató y por qué lo hizo.
    No pudo creer en qué momento lo hiciste.
    No se en qué estabas pensando.


    Me gustaría saber tu opinión en este punto.

    Saludos.
    Última edición por paconaranjo; 26-06-2013 a las 15:34:10

  4. #3
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    Estoy trabajando en una expresión para corregir los prefijos según las nuevas normas de la RAE:

    Normas sobre la escritura de los prefijos (incluido ex-, que ahora recibe el mismo tratamiento ortográfico que los demás prefijos: exmarido, ex primer ministro)

    Esto serviría para detectar este tipo de situaciones y corregirlas si solo se tratase de una sola unión. Para el caso de dos o más uniones, la cosa se complica un poco.

    PREFIJOS

    Spoiler:
    SPOILER:
    <!-- Prefijos; palabras compuestas (simple) -->
    <RegEx find="\bsuper[\s\x2D]([a-z]{3,20})([\.\,\s\S])" replaceWith="super$1$2" />
    <RegEx find="\banti[\s\x2D]([a-z]{3,20})([\.\,\s\S])" replaceWith="anti$1$2" />
    <RegEx find="\bpos[\s\x2D]([a-z]{3,20})([\.\,\s\S])" replaceWith="pos$1$2" />
    <RegEx find="\bpre[\s\x2D]([a-z]{3,20})([\.\,\s\S])" replaceWith="pre$1$2" />
    <RegEx find="\bpro[\s\x2D]([a-z]{3,20})([\.\,\s\S])" replaceWith="pro$1$2" />
    <RegEx find="\bvice[\s\x2D]([a-z]{3,20})([\.\,\s\S])" replaceWith="vice$1$2" />
    <RegEx find="\bex[\s\x2D]([a-z]{3,20})([\.\,\s\S])" replaceWith="ex$1$2" />

    Mi vida es super interesante. --> Mi vida es superinteresante.
    Eres super-genial. --> Eres supergenial.

    <!-- Prefijos; palabras compuestas (números) -->
    <RegEx find="\bsuper[\s\x2D](\d{2})([\.\,\s\S])" replaceWith="super-$1$2" />
    <RegEx find="\bsub[\s\x2D](\d{2})([\.\,\s\S])" replaceWith="sub-$1$2" />

    Pertenece a la sub 21 --> Pertenece a la sub-21

    <!-- Prefijos; palabras compuestas (mayúsculas) -->
    <RegEx find="\banti[\s\x2D]([A-Z]{2,10})([\.\,\s\S])" replaceWith="anti-$1$2" />
    <RegEx find="\bmini[\s\x2D]([A-Z]{2,10})([\.\,\s\S])" replaceWith="mini-$1$2" />
    <RegEx find="\bpos[\s\x2D]([A-Z]{2,10})([\.\,\s\S])" replaceWith="pos-$1$2" />
    <RegEx find="\bpro[\s\x2D]([A-Z]{2,10})([\.\,\s\S])" replaceWith="pro-$1$2" />
    <RegEx find="\banti[\s\x2D]([A-Z][a-z]{1,10})([\.\,\s\S])" replaceWith="anti-$1$2" />
    <RegEx find="\bmini[\s\x2D]([A-Z][a-z]{1,10})([\.\,\s\S])" replaceWith="mini-$1$2" />
    <RegEx find="\bpos[\s\x2D]([A-Z][a-z]{1,10})([\.\,\s\S])" replaceWith="pos-$1$2" />
    <RegEx find="\bpro[\s\x2D]([A-Z][a-z]{1,10})([\.\,\s\S])" replaceWith="pro-$1$2" />

    anti Obama --> anti-Obama
    anti CIA --> anti-CIA
    mini USB --> mini-USB



    Para casos como «ex primer ministro», la cosa se complica... Tienen que revisar las correcciones y ver cuales encajan y las que no, hacerlas a mano.
    Última edición por paconaranjo; 25-06-2013 a las 23:40:04

  5. #4
    Amigos de SubAdictos Avatar de jarzepol
    Fecha de ingreso
    30-03-2010
    Mensajes
    116
    Agradecimientos: 9

    Predeterminado

    Cita Iniciado por paconaranjo Ver mensaje
    Si te parece bien voy a poner tu mensaje en el tema y poco a poco voy poniendo solución donde la haya. Pero por lo que he visto hasta ahora, podemos corregir varios casos, a lo mejor no todos pero si la mayoría, nada más es cosa de buscar un patrón de comportamiento que siempre se repita.

    Ejemplo:

    En|sé|Y [por qué|cuándo|dónde|adónde|cómo|cuál|quién|qué|cómo|c uánto(s)|cuánta(s)]

    En lo que me he fijado es que cuando le antecede «sé» e «y» se acentúan, por lo menos eso creo.

    Sé qué hizo y dónde lo hizo.
    Sé adónde fue y cuánto tiempo tardó.
    Sé cuál de los dos lo mató y por qué lo hizo.
    No pudo creer en qué momento lo hiciste.
    No se en qué estabas pensando.


    Me gustaría saber tu opinión en este punto.

    Saludos.
    Pasa lo mismo que con algunos de los casos que te mencioné. Por ejemplo:
    - Sé qué íbamos a hacer, por eso no vine.
    - Sé que íbamos a salir, pero se me olvidó.
    - Él sabía que la casa era roja y que estaba al norte.
    - Él sabía que la casa era roja y qué había en el interior.
    - Descubramos qué vamos a hacer y cómo llegaremos hasta allá.
    - Descubramos qué vamos a hacer y, como falta mucho, seamos minuciosos en ello. [A veces cometemos el error de olvidar la coma luego de la "y" o la colocamos antes, con lo que entraría en el caso que expones. No sé me ocurrió otro ejemplo.]

    Puede que con "Sé (cuál|cuáles|dónde|cómo|quién|quiénes|cuánto)" sí funcione. Habría que pensarlo con detenimiento.

  6. #5
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    Cita Iniciado por jarzepol Ver mensaje
    Pasa lo mismo que con algunos de los casos que te mencioné. Por ejemplo:
    - Sé qué íbamos a hacer, por eso no vine.
    - Sé que íbamos a salir, pero se me olvidó.
    - Él sabía que la casa era roja y que estaba al norte.
    - Él sabía que la casa era roja y qué había en el interior.
    - Descubramos qué vamos a hacer y cómo llegaremos hasta allá.
    - Descubramos qué vamos a hacer y, como falta mucho, seamos minuciosos en ello. [A veces cometemos el error de olvidar la coma luego de la "y" o la colocamos antes, con lo que entraría en el caso que expones. No sé me ocurrió otro ejemplo.]

    Puede que con "Sé (cuál|cuáles|dónde|cómo|quién|quiénes|cuánto)" sí funcione. Habría que pensarlo con detenimiento.
    Pensé lo mismo con ciertos casos, sobre todo, en los que va involucrada la palabra «que». Con la coma tal vez podamos hacer algo.

    Uso incorrecto de la coma

    Spoiler:
    SPOILER:
    <RegEx find="(\b[Pp]ero),(\s)([¡¿])" replaceWith="$1$2$3" />
    Pero, ¡qué susto! --> Pero ¡qué susto!
    Pero, ¿quién es? --> Pero ¿quién es?

    <RegEx find="(\b[Aa]unque|\b[Aa]sí que),(\s|$)" replaceWith="$1$2" />
    Aunque, no sabría decirlo. --> Aunque no sabría decirlo.
    Así que, era de esperarse. --> Así que era de esperarse.


    Casos con «sé»

    Spoiler:
    SPOILER:
    <RegEx find="(\b[Ll]o|\b[Ll]a|\b[Ll]e)(\s)se" replaceWith="$1$2sé" />
    <RegEx find="[Ss]e\s(dónde\b|cuándo\b|adónde\b|cómo\b|cuál\b|quién\ b|cuánto\b|cuánta\b|cuántos\b|cuántas\b|cuán\b)" replaceWith="sé $1" />


    Casos con «té»

    Spoiler:
    SPOILER:
    <RegEx find="\b([Tt])e\s(verde\b|negro\b|perla\b|de\b)" replaceWith="$1é $2" />


    Casos con «sí»

    Spoiler:
    SPOILER:
    <RegEx find="\b([Ss])i(:|;|,|\.)" replaceWith="$1í$2" />



    Miscelánea

    Spoiler:
    SPOILER:
    <RegEx find="(\b[Cc]erca|\b[Ee]ncima|\b[Dd]ebajo|\b[Dd]etrás|\b[Dd]elante)(\s)mío" replaceWith="$1 de mí" />
    <RegEx find="(\b[Cc]erca|\b[Ee]ncima|\b[Dd]ebajo|\b[Dd]etrás|\b[Dd]elante)(\s)tuyo" replaceWith="$1 de ti" />

    Detrás mío. --> Detrás de mí.


    Vocativos (Se pueden añadir más casos; para esto necesito de su ayuda con muchos ejemplos)

    Spoiler:
    SPOILER:
    <RegEx find="(\b[A-Z][a-zá-ú]{3,12})\s(\bte\b|\bantes\b|¿|\bten\b|\bun\b|\bveng an\b|\bapoya\b|\bquiero\b|\bhijo\b)" replaceWith="$1, $2" />

    Original:
    Sebastián te he dicho que vengas.
    Carolina ¿cómo estás?
    Señor ¿me puede decir la hora?
    Lucía ten cuidado
    Mozo un helado.
    Niños vengan pronto a casa.
    Patricia apoya a tus hermanos.
    Mamá quiero chorizo.
    ¡Adios hijo!

    Corregido:
    Sebastián, te he dicho que vengas.
    Carolina, ¿cómo estás?
    Señor, ¿me puede decir la hora?
    Lucía, ten cuidado
    Mozo, un helado.
    Niños, vengan pronto a casa.
    Patricia, apoya a tus hermanos.
    Mamá, quiero chorizo.
    ¡Adios, hijo!

    <RegEx find="(\bHola|\bBueno|\bBien|\bVen|\bVen acá|\besto|\bBuenos días|\bFeliz cumpleaños|\bsiento)\s([A-Z][a-zá-ú]{3,12}\b|señorita\b|señor\b|hijo mío\b|amigo\b)" replaceWith="$1, $2" />

    Original:
    Hola Alfonso.
    Buenos días Rosalía.
    Feliz cumpleaños Marta.
    Lo siento señorita.
    Ven acá Jessie, antes de que me moleste
    Bueno hijo mío, no tenía ganas
    Bien señor.
    Quiero esto amigo.

    Corregido:
    Hola, Alfonso.
    Buenos días, Rosalía.
    Feliz cumpleaños, Marta.
    Lo siento, señorita.
    Ven acá, Jessie, antes de que me moleste
    Bueno, hijo mío, no tenía ganas
    Bien, señor.
    Quiero esto, amigo.


    Apóstrofo

    Spoiler:
    SPOILER:
    <RegEx find="(\b[A-Z][a-zá-ú]{3,12})\s(’|')(\d\d(\s|$))" replaceWith="$1 $3" />

    Original:
    Expo ’08
    Barcelona ’92
    Expo '08
    Barcelona '92

    Corregido:
    Expo 08
    Barcelona 92
    Expo 08
    Barcelona 92


    Ahora que tenga un tiempo libre voy a trabajar en las propuestas que me diste, si tienes alguna más me gustaría saberlo.

    PD: Sigo aprendiendo a usar este tipo de expresiones y acabo de encontrar una manera de simplificar muchas de las que ya he hecho.
    Última edición por paconaranjo; 26-06-2013 a las 15:48:00

  7. #6
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    Expresiones de las abreviaturas; abreviadas.

    Spoiler:
    SPOILER:
    <!-- a. m. y p. m. -->
    <RegEx find="(\d)(\s){0,1}([Aa])(\.){0,1}([Mm]){0,1}(\.){0,1}(\W){0,1}" replaceWith="$1 a. m.$7" />
    <RegEx find="(\d)(\s){0,1}([Pp])(\.){0,1}([Mm]){0,1}(\.){0,1}(\W){0,1}" replaceWith="$1 p. m.$7" />
    <!-- Horas -->
    <RegEx find="((\d)(\s){0,1}(h)(s\b|r\b|rs\b){0,1}(\.){0,1 }(\W){0,1}" replaceWith="$1 $3$6" />
    <!-- Kilómetros -->
    <RegEx find="(\d)(\s){0,1}([Kk])(m\b|ms\b){0,1}(\.){0,1}(\W){0,1}" replaceWith="$1 km$6" />
    <!-- Segundos -->
    <RegEx find="(\d)(\s){0,1}(s)(g\b|eg\b){0,1}(\.){0,1}(\W) {0,1}" replaceWith="$1 s$6" />
    <!-- Kilogramos -->
    <RegEx find="(\d)(\s){0,1}([Kk])(g\b|gs\b){0,1}(\.){0,1}(\W){0,1}" replaceWith="$1 kg$6" />
    <!-- Metros -->
    <RegEx find="(\d)(\s){0,1}(m)(t\b|ts\b){0,1}(\.){0,1}(\W) {0,1}" replaceWith="$1 m$6" />
    <!-- Kilobytes -->
    <RegEx find="(\d)KBs(\W){0,1}" replaceWith="$1 kB$2" />
    <!-- Número -->
    <RegEx find="([Nn])°(\s){0,1}(\d)" replaceWith="$1.° $3" />
    <RegEx find="([Nn])ro(\.){0,1}(\s){0,1}(\d)" replaceWith="$1.° $4" />


    Porcentaje

    Spoiler:
    SPOILER:
    <RegEx find="(\b\d{1,2})%(\W)" replaceWith="$1 %$2" />
    10% --> 10 %


    Ya estoy entendiéndole más a la sintaxis y voy a ir elaborando expresiones más complejas que a la vez simplifican lo que podrían hacer varias de ellas en una sola, así nos ahorramos unas cuantas líneas de más.
    Última edición por paconaranjo; 26-06-2013 a las 23:06:34

  8. #7
    Amigos de SubAdictos Avatar de jarzepol
    Fecha de ingreso
    30-03-2010
    Mensajes
    116
    Agradecimientos: 9

    Predeterminado

    Hola, paconaranjo.

    Hay varias expresiones que arreglan errores, pero a la vez introducen otros. Así que creo que deberías desistir con ellas. Me refiero cuando hay oraciones parentéticas en estos casos:

    - Uso incorrecto de la coma.
    Por ejemplo:
    - Pero, pese a que todos estuvimos presente, no sabría decirlo.
    - Así que, en mi opinión, deberías desistir.

    Tu expresión quitaría la coma.

    - Sí.
    Por ejemplo:
    - Si, una vez hecha la tarea, el niño quiere jugar, permíteselo.

    Tu expresión pondría la tilde cuando no va. Puede que funcione solo con el punto.

    - Coma vocativa.
    Aquí no trata de las oraciones parentéticas, sino la expresión en sí misma.

    Por ejemplo:
    - Como te he dicho que vengas tarde, ya no tienes que levantarte temprano.
    - La selección, que anualmente disputa un encuentro denominado "Triunfo total",...

    Tu expresión las dejaría así:
    - Como, te he dicho que vengas tarde, ya no tienes que levantarte temprano.
    - La selección, que anualmente disputa, un encuentro denominado "Triunfo total",...

    Los otros sí parecen funcionar bien.

  9. #8
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    Cita Iniciado por jarzepol Ver mensaje
    Hola, paconaranjo.

    Hay varias expresiones que arreglan errores, pero a la vez introducen otros. Así que creo que deberías desistir con ellas. Me refiero cuando hay oraciones parentéticas en estos casos:

    - Uso incorrecto de la coma.
    Por ejemplo:
    - Pero, pese a que todos estuvimos presente, no sabría decirlo.
    - Así que, en mi opinión, deberías desistir.

    Tu expresión quitaría la coma.
    Si ves la expresión, solo le quita la coma en este caso:

    2. Cuando pero precede a una construcción interrogativa o exclamativa no se pone coma; se pueden utilizar puntos suspensivos:


    Pero ¿qué me dices?
    Pero... ¡no puede ser!

    En cualquier otro caso no se la quita.


    3. Tampoco se coloca coma detrás de aunque ni de así que

    Según esa normativa no lleva y por eso les quita la coma después de esas expresiones.

    Tu trabajo no está completo, así que es mejor que lo repitas.
    Aunque había estudiado, no aprobé el examen.

    - Sí.
    Por ejemplo:
    - Si, una vez hecha la tarea, el niño quiere jugar, permíteselo.

    Tu expresión pondría la tilde cuando no va. Puede que funcione solo con el punto.
    Me parece que no lleva coma.


    - Si una vez hecha la tarea, el niño quiere jugar, permíteselo.

    - Coma vocativa.
    Aquí no trata de las oraciones parentéticas, sino la expresión en sí misma.

    Por ejemplo:
    - Como te he dicho que vengas tarde, ya no tienes que levantarte temprano.
    - La selección, que anualmente disputa un encuentro denominado "Triunfo total",...

    Tu expresión las dejaría así:
    - Como, te he dicho que vengas tarde, ya no tienes que levantarte temprano.
    - La selección, que anualmente disputa, un encuentro denominado "Triunfo total",...
    En esto tienes razón en cuanto al inicio de una oración. También se pueden poner las combinaciones más comunes aunque estas no sean muchas cuando comienza una frase o se pueden hacer en el caso de que le anteceda un espacio, por ejemplo: "Pero David te dije que no lo hicieras", en este caso si pone la coma después del nombre.

    La expresión quedaría algo como esto (nada más cambiaría lo que está en negritas):

    Spoiler:
    SPOILER:
    <RegEx find="(\s[A-Z][a-zá-ú]{3,12})\s(\bte\b|\bantes\b|¿|\bten\b|\bun\b|\bveng an\b|\bapoya\b|\bquiero\b|\bhijo\b|\bque\b)" replaceWith="$1, $2" />


    Ya me dirás lo que opinas de esto. Sería probarla a fondo; pero parece que funciona.

    Los otros sí parecen funcionar bien.
    Aquí dejo una más...

    Haz/has

    Spoiler:
    SPOILER:
    http://www.wikilengua.org/index.php/haz

    <RegEx find="(\b)([Hh])as\s(la\b|lo\b|clic\b)(\W)" replaceWith="$1$2az $3$4" />
    Has la tarea. --> Haz la tarea.
    Has lo que te dije. --> Haz lo que te dije.
    Has clic. --> Haz clic.

    <RegEx find="(\b)([Hh])az\s(de\b)(\W)" replaceWith="$1$2as $3$4" />
    Haz de pedir permiso. --> Has de pedir permiso.

    <RegEx find="(\b)([Hh])as(le\b|nos\b|me\b)(\W)" replaceWith="$1$2az$3$4" />
    Hasme caso. --> Hazme caso.
    Hasnos caso. --> Haznos caso.
    Hasle caso. --> Hazle caso.
    Última edición por paconaranjo; 27-06-2013 a las 20:52:12

  10. #9
    Amigos de SubAdictos Avatar de jarzepol
    Fecha de ingreso
    30-03-2010
    Mensajes
    116
    Agradecimientos: 9

    Predeterminado

    En el caso del "pero" tienes toda la razón, no debí prestarle la atención debida, pero no así con el "así que" ni con el "sí".

    Una oración parentética, para explicarlo simplemente, es una oración dentro de otra que aclara o puede dar más información. Estas oraciones pueden estar al inicio, al final o en un punto interno de la oración que la contiene, y se caracterizan por que puedes quitarla y la oración que la contiene mantiene su sentido.

    Si tomamos la oración ejemplo como crees que es correcta y le quitamos lo que está entre las comas, que es la que podría decirse que "aclara", quedaría así: "Si una vez hecha la tarea, permíteselo". Falta algo, ¿verdad?

    Ahora probemos con la oración ejemplo original. Si le quitamos lo que está entre la primera y la segunda coma, nos queda esta oración: "Si el niño quiere jugar, permíteselo." La oración mantiene su sentido.

    Lo mismo ocurre con la oración ejemplo que puse con el "así que". Las siguientes dos oraciones son correctas:

    - Así que, en mi opinión, deberías desistir.
    - Así que deberías desistir.

    Esta no:
    - Así que en mi opinión, deberías desistir.

    Sobre la coma vocativa, me parece que determinar las combinaciones más comunes es muy trabajoso.

    ¿Probaste la expresión regular que pusiste?

    Spoiler:
    SPOILER:
    <RegEx find="(\s[A-Z][a-zá-ú]{3,12})\s(\bte\b|\bantes\b|¿|\bten\b|\bun\b|\bveng an\b|\bapoya\b|\bquiero\b|\bhijo\b|\bque\b)" replaceWith="$1, $2" />


    Porque con el ejemplo "Pero David te dije que no lo hicieras" deja como resultado "Pero David, te dije, que no lo hicieras", cuando debió dejar "Pero, David, te dije que no lo hicieras". Además, si pruebas con "Pero David te hizo tu postre favorito", coincidiría con la expresión y haría un cambio incorrecto. (Una persona le indica a otra que David le preparó el postre que más le gusta)

    Por cierto, yo no uso el SW ni el SE para probar las expresiones, por lo que puede ser que se comporte diferente, pero lo más seguro es que no.

  11. #10
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    Cita Iniciado por jarzepol Ver mensaje
    En el caso del "pero" tienes toda la razón, no debí prestarle la atención debida, pero no así con el "así que" ni con el "sí".

    Una oración parentética, para explicarlo simplemente, es una oración dentro de otra que aclara o puede dar más información. Estas oraciones pueden estar al inicio, al final o en un punto interno de la oración que la contiene, y se caracterizan por que puedes quitarla y la oración que la contiene mantiene su sentido.

    Si tomamos la oración ejemplo como crees que es correcta y le quitamos lo que está entre las comas, que es la que podría decirse que "aclara", quedaría así: "Si una vez hecha la tarea, permíteselo". Falta algo, ¿verdad?

    Ahora probemos con la oración ejemplo original. Si le quitamos lo que está entre la primera y la segunda coma, nos queda esta oración: "Si el niño quiere jugar, permíteselo." La oración mantiene su sentido.

    Lo mismo ocurre con la oración ejemplo que puse con el "así que". Las siguientes dos oraciones son correctas:

    - Así que, en mi opinión, deberías desistir.
    - Así que deberías desistir.

    Esta no:
    - Así que en mi opinión, deberías desistir.

    Sobre la coma vocativa, me parece que determinar las combinaciones más comunes es muy trabajoso.

    ¿Probaste la expresión regular que pusiste?

    Spoiler:
    SPOILER:
    <RegEx find="(\s[A-Z][a-zá-ú]{3,12})\s(\bte\b|\bantes\b|¿|\bten\b|\bun\b|\bveng an\b|\bapoya\b|\bquiero\b|\bhijo\b|\bque\b)" replaceWith="$1, $2" />


    Porque con el ejemplo "Pero David te dije que no lo hicieras" deja como resultado "Pero David, te dije, que no lo hicieras", cuando debió dejar "Pero, David, te dije que no lo hicieras". Además, si pruebas con "Pero David te hizo tu postre favorito", coincidiría con la expresión y haría un cambio incorrecto. (Una persona le indica a otra que David le preparó el postre que más le gusta)

    Por cierto, yo no uso el SW ni el SE para probar las expresiones, por lo que puede ser que se comporte diferente, pero lo más seguro es que no.
    Lo mejor será quitarlas, gracias por la explicación. En el caso de sí, mediante las expresiones regulares podría detectar cuando esta es una oración parentética, por lo menos el patrón que veo es que todas llevan una segunda coma; al detectar esta segunda coma, no pondría el acento.

    ¿Qué opinas?

    Te adjunto un programa que uso para probarlas, está basado en .NET, ya que las expresiones regulares en cada programa son ligeramente distintas.

    Saludos y gracias por la ayuda.
    Archivos adjuntados Archivos adjuntados

  12. #11
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    Añadido programa para expresiones regulares y su traducción, aparte pueden descargar el programa para Windows, Linux o Mac OSX desde mi blog, que iré actualizando cuando lo crea necesario.

    Última edición por paconaranjo; 10-05-2014 a las 04:11:43

  13. Los siguientes usuarios agradecen a paconaranjo por este tema:

     peliac

  14. #12
    Amigos de SubAdictos Avatar de paconaranjo
    Fecha de ingreso
    08-04-2011
    Mensajes
    518
    Agradecimientos: 365

    Predeterminado

    // Punto antes de ¿ y ¡ //

    Spoiler:
    SPOILER:
    Expresión Regular

    ([\wá-ú])\s(?=(¿|¡)[A-ZÁ-Ú])

    Cemré ¿Quién era?

    Sustitución

    $1.

    Cemré. ¿Quién era?



    //Diálogos en una sola línea//

    Spoiler:
    SPOILER:
    Expresión Regular

    ^(-.+)(-.+(\!|\?|\.))$(?!\n.)

    1
    - ¿De verdad? - Sí.

    2
    - Hola. - ¿Qué pasó?

    3
    - Hola. - ¡Guau!

    Sustitución

    $1\n$2

    1
    - ¿De verdad?
    - Sí.

    2
    - Hola.
    - ¿Qué pasó?

    3
    - Hola.
    - ¡Guau!

  15. Los siguientes usuarios agradecen a paconaranjo por este tema:

     peliac

  16. #13
    Subtitulador Avatar de peliac
    Fecha de ingreso
    01-12-2010
    Ubicación
    Buenos Aires
    Mensajes
    17,051
    Agradecimientos: 17915

    Predeterminado

    Gracias paconaranjo y jarzepol.
    Sumamente rico el intercambio.

Información de tema

Usuarios viendo este tema

Actualmente hay 1 usuarios viendo este tema. (0 miembros y 1 visitantes)

Temas similares

  1. MINI GUÍA: Subtitle Edit
    Por paconaranjo en el foro Tutoriales Para Programas de Subtítulos
    Respuestas: 37
    Último mensaje: 26-08-2015, 04:54:30
  2. Debrid Sites - Guia de DDs
    Por rax369 en el foro Tutoriales Para Descargas y Videos
    Respuestas: 2
    Último mensaje: 07-04-2012, 07:13:26
  3. Respuestas: 6
    Último mensaje: 13-03-2012, 00:29:53

Miembros que han leído este tema: 1

Permisos de publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •