[pyar] Seleccionar elementos de un txt
Javier Castrillo
riverplatense en gmail.com
Mar Ene 31 13:04:51 ART 2012
> Si sacar las palabras con caracteres acentuados y ñ equivale a
> quedarse con las que sólo tienen caracteres de la a a la z podés
> quedarte con las palabras que matcheen con esa expresión regular.
>
> pattern = re.compile("^\w+$")
>
> y comparás con
>
> if pattern.match(palabra):
> ...
Impresionante, parseó 64000 palabras en menos de un pestañeo.
Muchas gracias, les dejo el código final:
Mil gracias nuevamente
#! /usr/bin/python
# -*- coding:UTF-8 -*-
import re
f = open("wordlist.txt", "r")
n = open("wordlist_nuevo.txt", "w")
pattern = re.compile("^\w+$")
while True:
palabra = f.readline()
if not palabra:
break
if pattern.match(palabra):
n.write(palabra)
f.close()
n.close()
--
Javier Castrillo
=========================================================
GNU / Linux User #242275
Jabber: javier en nube.usla.org.ar
Blog: http://evitalinuxera.com.ar
Site: http://javiercastrillo.com.ar
TCOS: http://argentina.tcosproject.org
PGP ID: 5BB08988
Twitter: @evitalinuxera
Identi.ca: @evitalinuxera
Skype: carapachense
=========================================================
Usá Software Libre
More information about the pyar
mailing list