公告版位

目前分類:14. jsoup (7)

瀏覽方式: 標題列表 簡短摘要

為了避免XSS攻擊, 也就是https://en.wikipedia.org/wiki/Cross-site_scripting

網站內的script會破壞頁面的擷取或是有惡意的行為

文章標籤

RX1226 發表在 痞客邦 留言(0) 人氣()

擷取html內容之後

會需要對其內容作修改

文章標籤

RX1226 發表在 痞客邦 留言(0) 人氣()

這篇探討用jsoup來解析取得的元素

基本的作法都是取得Element之後, 用.屬性來取得欄位值

文章標籤

RX1226 發表在 痞客邦 留言(0) 人氣()

jsoup提供了另一種解析html的方法

就是利用selector, 非常靈活, 還可以下條件組合

文章標籤

RX1226 發表在 痞客邦 留言(0) 人氣()

DOM就是Document Object Model

也就是將整個html檔案看成一個tree, 上面有很多節點和內容值

文章標籤

RX1226 發表在 痞客邦 留言(0) 人氣()

jsoup取得html方法基本有三種

a. 從String b.從網路 c. 從檔案

文章標籤

RX1226 發表在 痞客邦 留言(0) 人氣()

Java要解析Html網頁用jsoup是個好選擇

這篇介紹jsoup的官網, 下載點, 以及教學文件

文章標籤

RX1226 發表在 痞客邦 留言(0) 人氣()