
為了避免XSS攻擊, 也就是https://en.wikipedia.org/wiki/Cross-site_scripting
網站內的script會破壞頁面的擷取或是有惡意的行為
所以jsout提供了whitelist白名單的方法來處理
RX1226 發表在 痞客邦 留言(0) 人氣(747)

擷取html內容之後
會需要對其內容作修改
這篇就介紹如下
RX1226 發表在 痞客邦 留言(0) 人氣(212)

這篇探討用jsoup來解析取得的元素
基本的作法都是取得Element之後, 用.屬性來取得欄位值
介紹如下
RX1226 發表在 痞客邦 留言(0) 人氣(156)

jsoup提供了另一種解析html的方法
就是利用selector, 非常靈活, 還可以下條件組合
介紹如下
RX1226 發表在 痞客邦 留言(0) 人氣(6,034)

DOM就是Document Object Model
也就是將整個html檔案看成一個tree, 上面有很多節點和內容值
以下就介紹其作法
RX1226 發表在 痞客邦 留言(0) 人氣(919)

jsoup取得html方法基本有三種
a. 從String b.從網路 c. 從檔案
以下就介紹其方法
RX1226 發表在 痞客邦 留言(0) 人氣(833)

Java要解析Html網頁用jsoup是個好選擇
這篇介紹jsoup的官網, 下載點, 以及教學文件
1. 官網https://jsoup.org/
RX1226 發表在 痞客邦 留言(0) 人氣(941)