BeautifulSoup

(littéralement « Belle Soupe ») est un bibliothèque de parsage pour le langage (X)HTML écrit en Python par Leonard Richardson. Cette bibliothèque logicielle peut aussi être utilisée pour traiter du XML. Lorsque le document XML/HTML soumis est mal formé, propose une approche à base d’heuristiques afin de reconstituer automatiquement l’arbre sans générer d’erreur. Cette approche est aussi utilisée par les navigateurs web modernes. Un document HTML mal formé se compose, par exemple, de balises non fermées. Elle est disponible pour Python 2.6+ et Python 3.

Laisser un commentaire