[pyar] Seleccionar elementos de un txt

Javier Castrillo riverplatense en gmail.com
Mar Ene 31 13:04:51 ART 2012


> Si sacar las palabras con caracteres acentuados y ñ equivale a
> quedarse con las que sólo tienen caracteres de la a a la z podés
> quedarte con las palabras que matcheen con esa expresión regular.
>
> pattern = re.compile("^\w+$")
>
> y comparás con
>
> if pattern.match(palabra):
> ...

Impresionante, parseó 64000 palabras en menos de un pestañeo.
Muchas gracias, les dejo el código final:


Mil gracias nuevamente

#! /usr/bin/python
# -*- coding:UTF-8 -*-

import re

f = open("wordlist.txt", "r")
n = open("wordlist_nuevo.txt", "w")
pattern = re.compile("^\w+$")

while True:
    palabra = f.readline()
    if not palabra:
        break
    if pattern.match(palabra):
        n.write(palabra)
f.close()
n.close()


-- 
Javier Castrillo

=========================================================
GNU / Linux User #242275

Jabber: javier en nube.usla.org.ar
Blog: http://evitalinuxera.com.ar
Site:    http://javiercastrillo.com.ar
TCOS: http://argentina.tcosproject.org
PGP ID: 5BB08988
Twitter: @evitalinuxera
Identi.ca: @evitalinuxera
Skype: carapachense
=========================================================
Usá Software Libre



More information about the pyar mailing list