0
0 комментариев
import sys
from PySide.QtGui import *
from PySide.QtCore import *
from PySide.QtWebKit import *
from lxml import html
import requests
 
 
class Render(QWebPage):
    def __init__(self, url):
        self.app = QApplication(sys.argv)
        QWebPage.__init__(self)
        self.loadFinished.connect(self._loadFinished)
        self.mainFrame().load(QUrl(url))
        self.app.exec_()
 
    def _loadFinished(self, result):
        self.frame = self.mainFrame()
        self.app.quit()
 
url = 'http://www.****'
r = Render(url)
tree = r.frame.toHtml()

Получаю через PySide страницу (данные тянуться через javascript). Потом хочу ее отпарсить при помощи lxml. Но она не парсится, так как, значение tree строковое. Как решить данную проблему?


Добавить комментарий