這篇探討用jsoup來解析取得的元素
基本的作法都是取得Element之後, 用.屬性來取得欄位值
介紹如下
1. 官網https://jsoup.org/cookbook/extracting-data/attributes-text-html
2. 簡單的例子
元素.id() 可取得id, 如果沒有則回空字串
元素.tag() 可取得tag, 如果沒有則回空字串
元素.tagName() 可取得tag的名稱, 如果沒有則回空字串
元素.className() 可取得class的名稱, 如果沒有則回空字串
元素.text() 可取得內容, 如果沒有則回空字串
String html = "<html><head><title>First parse</title></head>"
+ "<body>"
+ "<p>Line 1.</p>"
+ "<p>Line 2.</p>"
+ "<p>Line 3.</p>"
+ "</body></html>";
Document doc = Jsoup.parse(html);
Element contents = doc.getElementsByTag("p").first();
System.out.println( contents.id() ); //
System.out.println( contents.tag() ); //p
System.out.println( contents.tagName() ); //p
System.out.println( contents.className() ); //
System.out.println( contents.text() ); // Line 1.