欢迎访问悦橙教程(wld5.com),关注java教程。悦橙教程  java问答|  每日更新
页面导航 : > > 文章正文

java中如何移除html标签和html entiry,javaentiry,我们可以很方便的通过正则

来源: javaer 分享于  点击 2166 次 点评:110

java中如何移除html标签和html entiry,javaentiry,我们可以很方便的通过正则


我们可以很方便的通过正则表达式替换所有标签,例如

replaceAll("\\<.*?>","");

但是这个方法处理不了之类的html实体。

最好的办法是使用Jsoup,Jsoup可以很简单的将html转换为文本,而且保证转换的万无一失。

public static String html2text(String html) {    return Jsoup.parse(html).text();}
相关栏目:

用户点评