導航頁的數據都是 " /> 国产欧美日韩亚洲第一页,国产成人ae在线观看网站站,亚洲精品第一国产综合

天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

用PHP代替JS玩轉DOM的思路及示例代碼

事情的起源比較簡單,我需要把一個導航頁的數據整理好寫入數據庫。一個比較直觀的方法是對html文件進行分析,通用的方法是用php的正則表達式來匹配。但是這樣做開發和維護都很困難,代碼可讀性非常差。

導航頁的數據都是規則的排列在DOM樹當中的,用JS可以用幾個循環輕松的對其進行操作,而且JS需要依賴瀏覽器,操作數據庫很困難。其實php就有現成的類庫對DOM樹種的節點進行增刪改查操作,在此做一些筆記。

這里涉及到2個類 DOMDocument 和 DOMXPath。

其實思路比較明確,就是通過DOMDocument將一個html file轉換成DOM樹的數據結構,再用DOMXPath的實例去搜索這個DOM樹,拿到想要特定節點,接下來就可以對當前節點的子樹進行遍歷,得到想要的結果。

在當前目錄下有一個這樣一個導航的html文件 "./hao.html"

現在需要得到所有<a>標簽的中文內容,php代碼如下:
復制代碼 代碼如下:
<?php
//將html/xml文件轉換成DOM樹
$dom = new DOMDocument();
$dom->loadHTMLFile("hao.html");

//得到所有class為fix的dl標簽

// example 1: for everything with an id
//$elements = $xpath->query("http://*[@id]");

// example 2: for node data in a selected id
//$elements = $xpath->query("/html/body/div[@id='yourTagIdHere']");

// example 3: same as above with wildcard
//$elements = $xpath->query("*/div[@id='yourTagIdHere']");
$xpath = new DOMXPath($dom);
$dls = $xpath->query('//dl[@class="fix"]');

foreach ($dls as $dl) {
$spans = $dl->childNodes;
foreach ($spans as $span) {
echo trim($span->textContent)."/t";
}
echo "/n";
}
?>

輸出結果如下:

注意:值得注意的一點是DOMDocument的默認編碼方式是Latin,所以在處理utf編碼的中文的時候,需要在<head>后面緊跟著填入
復制代碼 代碼如下:
<meta http-equiv="content-type" content="text/html; charset=utf-8">

在其他位置,或者是只寫上<meta content="charset=utf-8">都是不識別的哦

php技術用PHP代替JS玩轉DOM的思路及示例代碼,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 色噜噜狠狠色综合中文字幕 | 日韩欧美三区 | 亚洲你我色 | 美女医生深夜在家裸睡惨死 | 永久免费看mv网站入口 | 日本伦子欲 | 国产精品美女久久久网站动漫 | 国产97视频在线观看 | 视频成人永久免费视频 | 2224x最新网站 | 国产亚洲精品久久久久久禁果TV | 十分钟免费看完整视频 | 伊人青青草 | 国产在线精品一区二区在线看 | 暖暖免费 高清 日本社区中文 | 久久夜色撩人精品国产 | 免费果冻传媒2021在线看 | 毛片免费在线播放 | 久久99国产亚洲高清观着 | 亚洲AV永久无码精品澳门 | 国产精品免费观看视频 | 欧美精品3atv一区二区三区 | 国产白丝JK被疯狂输出视频 | 99在线精品国自产拍不卡 | 亲胸揉胸膜下刺激视频网站APP | 国产精品久久久久影院免费 | 韩国免费啪啪漫画无遮拦健身教练 | 国产在线一区观看 | 美美哒免费影视8 | 久久国产精品无码视欧美 | 好妞操| 冈本视频黄页正版 | 欧美日韩一区二区三区四区 | 亚洲一区二区三区高清网 | 东北老妇xxxxhd| 亚洲电影网址 | 久久黄色小视频 | 欧美激情一区二区三区视频 | av影音先锋影院男人站 | 中文字幕绝色少妇性 | 久99视频精品免费观看福利 |