java中如何移除html标签和html entiry,javaentiry,我们可以很方便的通过正则
分享于 点击 2166 次 点评:110
java中如何移除html标签和html entiry,javaentiry,我们可以很方便的通过正则
我们可以很方便的通过正则表达式替换所有标签,例如
replaceAll("\\<.*?>","");
但是这个方法处理不了之类的html实体。
最好的办法是使用Jsoup,Jsoup可以很简单的将html转换为文本,而且保证转换的万无一失。
public static String html2text(String html) { return Jsoup.parse(html).text();}
用户点评