0
0 Комментариев

например у меня вот такая строка

desc=u"привет 123123123 🙆🏼🙆🏼🙆🏼 тут какой то текст 12349! abcde 123"

частично решение я нашел:

re.sub(r'[^\x00-\x7F]+',' ', desc)

или

"".join(filter(lambda x: ord(x)<128,desc.decode('utf-8')))

но проблема в том что удаляются все кириллические символы и получается:

 123123123      12349! abcde 123

а еще в строке может быть м², это же тоже получается спецсимвол. его я бы хотел оставить.


Добавить комментарий