python去掉html标签的函数
Python似乎没有像PHP那样方便的函数丢弃掉字符串中所有的HTML标签,下面是一个简单的函数达到该目的。
- from HTMLParser import HTMLParser
- def strip_tags(html):
- html = html.strip()
- html = html.strip("\n")
- result = []
- parser = HTMLParser()
- parser.handle_data = result.append
- parser.feed(html)
- parser.close()
- return ''.join(result)
感谢您的关注。您现在可以 阅读留言(1) 或 留下通告地址 。
相关信息
该文章 2007年02月08日 提交,位于分类 Python 下. 标签: .您可以通过 留言聚合 查看留言。 您可以 留言,或者 留下通告地址。
上一篇: python读取QQWry.Dat的代码 »
下一篇: WordPress2.1所见即所得文本编辑器无效的问题 »


5月 27th, 2008 20:12
Cool,多谢了。