0
0 Комментариев

Помогите составить регулярное выражение на Python. Имеем HTML страницу. Вот часть ее содержимого:

<p>На сегодняшний день PHP является наиболее распространенным языком веб-программирования. Подавляющие большинство сайтов и веб-сервисов в интернете
написано с помощью PHP. По некоторым оценкам PHP применяется более чем на 80% сайтов, среди которых такие сервисы, как facebook.com, vk.com, baidu.com и
другие. И такая популярность неудивительна. Простота языка позволяет быстро и легко создавать сайты и порталы различной сложности.</p>
<p>PHP был создан в 1994 году датским программистом Расмусом Лердорфом и изначально представлял собой набор скриптов на другом языке Perl. Позже этот
набор скриптов был переписан в интерпретатор на языке Си. И с самого возникновения PHP (сокращение от PHP: Hypertext Preprocessor - PHP: Препроцессор гипертекста)
представлял удобный набор инструментов для упрощенного создания веб-сайтов и веб-приложений.</p>
<p>Какие преимущества предоставляет PHP?</p>

Необходимо найти весь текст который заключен между тегами

.

Составил выражение: ".*

(.*)"

На выходе получаю:

«На сегодняшний день PHP является наиболее распространенным языком
веб-программирования. Подавляющие большинство сайтов и веб-сервисов в
интернете «

После слова интернете «интернете» я так понимаю есть «\n» поэтому моё РВ не срабатывает. Как составить правильно? Необходимо все, что заключено между каждыми " использую re.findall


Добавить комментарий