欢迎访问悦橙教程(wld5.com),关注java教程。悦橙教程  java问答|  每日更新
页面导航 : > > 文章正文

Jericho HtmlParser源代码单文件版,解析html中的table,jerichohtmlparser,使用jericho ht

来源: javaer 分享于  点击 10121 次 点评:268

Jericho HtmlParser源代码单文件版,解析html中的table,jerichohtmlparser,使用jericho ht


使用jericho htmlparser解析html中的table,轻松获取表格中的内容

解析html中的table

package cn.outofmemory.htmlparser.jericho;import java.io.*;import java.net.*;import java.util.*;public class TableContentByHtmlParse {    public Element getTableContent(Element element,int rows,int cols)    {        Element resultElement=null;        List<Element> trList=element.getAllElements(HTMLElementName.TR);        if(rows<trList.size())        {            Element trElement=trList.get(rows);            List<Element> tdList=trElement.getAllElements(HTMLElementName.TD);            if(cols<tdList.size())            {                //Element tdElement=tdList.get(cols);                resultElement=tdList.get(cols);            }        }        return resultElement;    }    public static void test(String url)    {        Source source=null;        try        {            source=new Source(new URL(url));        }        catch(MalformedURLException e)        {            e.printStackTrace();        }        catch(IOException e)        {            e.printStackTrace();        }        List<Element> elementList=source.getAllElements(HTMLElementName.TABLE);        for(Element element:elementList)        {            Element currentElement=new TableContentByHtmlParse().getTableContent(element,2,2);            if(currentElement!=null)            System.out.println(currentElement.getContent().toString());        }    }    public static void main(String[] args)    {        test("http://byrx.net/");    }}
相关栏目:

用户点评