[pyar] Aprendé Python con el tutorial en Español!

Martín Gaitán gaitan en gmail.com
Lun Mar 31 18:03:00 ART 2014


2014-03-31 17:40 GMT-03:00 Manuel Kaufmann <humitos en gmail.com>:

> 2014-03-31 17:02 GMT-03:00 Martín Gaitán <gaitan en gmail.com>:
> > Pregunta: cómo es el trabajo de "mantener" esta traducción? hay alguna
> > memoria de traducción? se usa algun CAT? o es a fuerza de lectura y
> revisión
> > "manual"?
>
>
> No estoy seguro qué es una "memoria de traducción" y ni idea que es un
> "CAT". ¿Me explicás?
>
> Lo que se hace es lo que dice el README.md del proyecto[1], en pocas
> palabras: un "git diff" de lo que tenemos contra la versión original
> del repositorio oficial de Python y se actualizan las partes que
> cambiaron. ¿Tenés alguna idea mejor? (comentame ahora porque tengo el
> 80% del script que me automatiza ese proceso hecho ;) )
>
> [1] https://github.com/PyAr/tutorial#pasos-para-actualizar-el-tutorial
>
>
CAT es "Computer Assisted translation". O sea, software para *ayudar* a
traducir. En general se basan en una o más "memorias de traducción"

http://en.wikipedia.org/wiki/Translation_memory

Conceptualmente es sencillo, pero mucho más obvio en la "localización".
Funciona así:
cuando un segmento (en general, una oración), del texto fuente matchea 100%
con una ya traducida en la memoria (un "diccionario" clave valor) ,
entonces la traducción es automática. Como colorario, es muy fácil detectar
los segmentos "nuevos" o que cambiaron levemente y obtener
sugerencias/contextos basadas en fuzzymatching.

Asi es que para documentos técnicos, donde el glosario y las construcciones
gramaticales se repiten mucho, una buena memoria de traducción te ayuda
muchisimo. De hecho, en la "industria de la traducción", estos porcentajes
de repeticiones se miden (con los mismos software CAT) y muchas veces se
pagan menos.

El software CAT libre mas conocido es OmegaT (java) [2], pero bastante feo
en cuanto a UI. Algo superador (y en python!), pero por otro lado no
enfocado en la traducción de documentos sino en localización, traducción de
subtitulos, etc,  (donde los segmentos son explictios) es todo el toolkit
de translatehouse.org, en particular http://en.wikipedia.org/wiki/Pootle  y
http://en.wikipedia.org/wiki/Virtaal <http://en.wikipedia.org/wiki/Pootle>

Pootle particulamente es interesante porque es una opción libre a
plataformas como Transifex [3] que se usan mucho para localizar software
colaborativamente: una aplicación en la nube, donde la memoria se va
generando colaborativamente.

Para usarlo para un documento no es tan directo, porque primero hay que
generar "segmentos" desde el documento fuente. Una opción es usar txt2po
que viene el toolkit, pero sería genial tener algo un poco más inteligente,
que tenga en cuenta el formato (por ejemplo, restructuredText) para la
separación y "reconstrucción" de segmentos.


[1] http://en.wikipedia.org/wiki/Translation_memory
[2] http://www.omegat.org/es/omegat.html
[3] https://www.transifex.com
[4] http://translate-toolkit.readthedocs.org/en/latest/commands/txt2po.html
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20140331/3f0ba92a/attachment.html>


More information about the pyar mailing list