0
0 Комментариев

Добрый день!
1. Версия питона Python 3.6.9
2. Description: Ubuntu 18.04.3 LTS Release: 18.04 Codename: bionic
3. locale -a
C
C.UTF-8
en_US.utf8
POSIX
ru_RU.utf8
ru_UA.utf8

Пытаюсь осилить написание простого скрипта для замены русских символов в html файле

Для начала пытаюсь хотя бы в одном файле:
[code python]# -*- coding: utf-8 -*-

with open (‘/home/alex/SITE/index.html’, ‘r’, encoding=’windows-1251′) as f:
old_data = f.read()

new_data = old_data.replace(‘Адес ‘, ‘Адрес редакции’)

with open (‘/home/alex/SITE/index.html’, ‘w’, encoding=’windows-1251′) as f:
f.write(new_data)[/code]

Вывод:
[code bash]Traceback (most recent call last):
File «replace.py», line 4, in <module>
old_data = f.read()
File «/usr/lib/python3.6/codecs.py», line 321, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc3 in position 212: invalid continuation byte
[/code]
Кто подскажет?
Глобальная же задача — есть много html файлов в десятках папок, нужно пропарсить и заменить строки во всех html файлах по шаблону(глубина */index.html, */*/index.html, */*/*/index.html)
Буду очень признателен!
Заранее спасибо!


Добавить комментарий