[ Источник: html-text ]
Пакет: python3-html-text (0.6.2-1)
Ссылки для python3-html-text
Ресурсы Debian:
- Сообщения об ошибках
- Developer Information
- Debian журнал изменений
- Файл авторских прав
- Отслеживание заплат Debian
Исходный код html-text:
Сопровождающий:
Внешние ресурсы:
- Сайт [github.com]
Подобные пакеты:
extract text from HTML.
How is html_text different from .xpath('//text()') from LXML or .get_text() from Beautiful Soup ?
* Text extracted with html_text does not contain inline styles, javascript, comments and other text that is not normally visible to users; * html_text normalizes whitespace, but in a way smarter than .xpath('normalize-space()), adding spaces around inline elements (which are often used as block elements in html markup), and trying to avoid adding extra spaces for punctuation; * html-text can add newlines (e.g. after headers or paragraphs), so that the output text looks more like how it is rendered in browsers.
Другие пакеты, относящиеся к python3-html-text
|
|
|
|
-
- dep: python3
- интерактивный высокоуровневый объектно-ориентированный язык (версия python3 по умолчанию)
-
- dep: python3-lxml
- pythonic binding for the libxml2 and libxslt libraries
Загрузка python3-html-text
Архитектура | Размер пакета | В установленном виде | Файлы |
---|---|---|---|
all | 9,6 Кб | 41,0 Кб | [список файлов] |