0
0 комментариев
import sys
from PySide.QtGui import *
from PySide.QtCore import *
from PySide.QtWebKit import *
from lxml import html
import requests
 
 
class Render(QWebPage):
    def __init__(self, url):
        self.app = QApplication(sys.argv)
        QWebPage.__init__(self)
        self.loadFinished.connect(self._loadFinished)
        self.mainFrame().load(QUrl(url))
        self.app.exec_()
 
    def _loadFinished(self, result):
        self.frame = self.mainFrame()
        self.app.quit()
 
url = 'http://www.****'
r = Render(url)
tree = r.frame.toHtml()

Получаю через PySide страницу (данные тянуться через javascript). Потом хочу ее отпарсить при помощи lxml. Но она не парсится, так как, значение tree строковое. Как решить данную проблему?

Изменен статус публикации
Добавить комментарий