欢迎访问悦橙教程(wld5.com),关注java教程。悦橙教程  java问答|  每日更新
页面导航 : > > 文章正文

批量改变HTML文件的meta信息中的编码方式,,有的时候html文件的编

来源: javaer 分享于  点击 32457 次 点评:248

批量改变HTML文件的meta信息中的编码方式,,有的时候html文件的编


有的时候html文件的编码方式与meta信息中指定的编码方式不同,可以通过这段代码搞一下。 此程序依赖jsoup和commons-io包

依赖jsoup和commons的io包

import java.io.File;import java.io.FileWriter;import java.io.IOException;import java.io.Writer;import java.util.Iterator;import org.apache.commons.io.FileUtils;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class main {    /**     * @param args     * @throws IOException     */    public static void main(String[] args) throws IOException {        // TODO Auto-generated method stub        File input = new File("C:\\Users\\jack\\Desktop\\新建文件夹\\jdk-zh");        Iterator<File> it = FileUtils.iterateFiles(input, null, true);        while (it.hasNext()) {            File file = it.next();            Document doc = Jsoup.parse(file, "gb2312");            Elements content = doc.getElementsByAttributeValueStarting("content", "text/html;");            for (Element meta : content) {                meta.attr("content", "text/html; charset=utf-8");                System.out                        .println("修改content--------" + file.getName() + "---");            }            FileUtils.writeStringToFile(file, doc.html(),"utf-8");        }    }}
相关栏目:

用户点评