0
0 комментариев

Я делаю свой первый проект и остановился в одном месте. У меня проблема с кодировкой или, возможно, с чем-то другим.

import urllib.request
import re
 
url = urllib.request.urlopen("http://olx.pl/sport-hobby/rowery/radomsko/?search%5Bdist%5D=30")
page_code = url.read().decode("utf-8")
 
prices_regex = '<p class="price">(.+?)</p>'
prices_pattern = re.compile(prices_regex)
 
prices = re.findall(prices_pattern, str(page_code))
 
for a in prices:
    print(a)

Если я напишу так, как выше, то после компиляции не покажет ничего. Если я оставлю только команду page_code, то показывает код страницы с верной кодировкой. А если я напишу так:

import urllib.request
import re
 
url = urllib.request.urlopen("http://olx.pl/sport-hobby/rowery/radomsko/?search%5Bdist%5D=30")
page_code = url.read()
 
prices_regex = '<p class="price">(.+?)</p>'
prices_pattern = re.compile(prices_regex)
 
prices = re.findall(prices_pattern, str(page_code))
 
for a in prices:
    print(a)

Покажет то, что я хочу, только в неправильной кодировке. Я думал, что можно написать decode после print. Но есть ещё одна проблема. Я не знаю как использовать decode с функцией list.


Добавить комментарий