0
0 комментариев

Подскажите пожалуйста как получить содержимое ссылок c BeautifulSoup(html, ‘lxml’)? Не сами ссылки а название!
есть вот такой код:

html = urllib.request.urlopen('https://kyxni.pro/katalog/')
soup = BeautifulSoup(html, 'html.parser').find('div', class_='builder-posts-wrap')
for i in soup.find_all('h2', class_='post-title'):
print(i)

выводит ссылки:

<h2 class="post-title entry-title"><a href="https://kyxni.pro/kuxnya-elegiya/">Кухня ЭЛЕГИЯ</a> </h2>
<h2 class="post-title entry-title"><a href="https://kyxni.pro/kuxnya-diana/">Кухня ДИАНА</a> </h2>
<h2 class="post-title entry-title"><a href="https://kyxni.pro/kuxni-temza/">Кухня ТЕМЗА</a> </h2>

а я хочу получить сами названия:

Кухня ЭЛЕГИЯ
Кухня ДИАНА
Кухня ТЕМЗА
и т.д.

Подскажите пожалуйста как это реализовать?

И как можно открыть сохранённую страницу, что бы каждый раз сайт не грузить?
Такая конструкция в коде который выше не работает

html = open('kuhni.html').read()

Изменен статус публикации
Добавить комментарий