jueves, 11 de agosto de 2016

¿CÓMO MOSTRAR EL CÓDIGO HTML DE UNA PÁGINA WEB CON PYTHON?

Hola en esta entrada voy a mostrar un código que permite obtener el código HTML de cualquier página el Python.

En este caso se obtiene el código HTML de la página www.google.com


 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
import sys
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl
from PyQt4.QtWebKit import QWebView


class Browser(QWebView):
    def __init__(self):
        QWebView.__init__(self)
        self.loadFinished.connect(self._result_available)

    def _result_available(self, ok):
        frame = self.page().mainFrame()
        print unicode(frame.toHtml()).encode('utf-8')

if __name__ == '__main__':
    app = QApplication(sys.argv)
    view = Browser()
    view.load(QUrl('http://www.google.com'))
    app.exec_()

Al ejecutar el código, obtenemos:
 Es todo. Muchas gracias.

No hay comentarios.:

Publicar un comentario