DOM就是Document Object Model

也就是將整個html檔案看成一個tree, 上面有很多節點和內容值

以下就介紹其作法

 

1. 官網https://jsoup.org/cookbook/extracting-data/dom-navigation

01.png

 

2. 這邊介紹將html的中的每行取出來

在使用的時候, 可以用Elements或Element來裝取內容

用getElementsByTag("Tag名稱")等等之類的方式來取得

  String html = "<html><head><title>First parse</title></head>"
      + "<body>"
      + "<p>Line 1.</p>"
      + "<p>Line 2.</p>"
      + "<p>Line 3.</p>"
      + "</body></html>";
  Document doc = Jsoup.parse(html);
    
  Elements contents = doc.getElementsByTag("p");
  for (Element content : contents) {
    System.out.println(content.text());
  }

02.png

 

3. 下列是相關的methos

找元素

03.png  

arrow
arrow

    RX1226 發表在 痞客邦 留言(0) 人氣()