HTMLParser имеет функциональность в стандартной библиотеке. Это, к сожалению, не документировано:
>>> import HTMLParser
>>> h= HTMLParser.HTMLParser()
>>> h.unescape('alpha < β')
u'alpha < \u03b2'
>>> import html.parser
>>> h = html.parser.HTMLParser()
>>> h.unescape('alpha < β')
'alpha < \u03b2'
htmlentitydefs документируется, но требует, чтобы Вы сделали большую работу сами.
, Если Вам только нужен XML, предопределил объекты (лейтенант, gt, усилитель, кавычка, apos), Вы могли использовать minidom для парсинга их. Если Вам только нужны предопределенные объекты и никакие ссылки цифрового символа, Вы могли бы даже просто использовать простую строковую замену для скорости.
В репозиториях PPA не было официального пакета glc для «raring» и «saucy». Поэтому нам нужно отредактировать файл репозитория для установки glc в Ubuntu 13.10,
sudo add-apt-repository ppa:arand/ppa
sudo gedit /etc/apt/sources.list.d/arand-ppa-saucy.list
изменить «saucy» на "точный", затем сохраните файл. Теперь запустите,
sudo apt-get update
sudo apt-get install glc