【前言】 不管是桌面软件开发,还是WEB应用,XML无处不在! 然而在平时的工作中,仅仅是使用一些已经封装好的类对XML对于处理,包括生成,解析等。假期有空,于是将PHP中的几种XML解析 方法 总结如下: 以解析Google API 接口提供的天气情况为例,我们取今天的天气及气温。 API地址:http://HdhCmsTestgoogle测试数据/ig/api?weather=shenzhen 【XML文件内容】 <?xml version="1.0"?> <xml_api_reply version="1"> <weather module_id="0" tab_id="0" mobile_row="0" mobile_zipped="1" row="0" section="0" > <forecast_information> <city data="Shenzhen, Guangdong"/> <postal_code data="shenzhen"/> <latitude_e6 data=""/> <longitude_e6 data=""/> <forecast_date data="2009-10-05"/> <current_date_time data="2009-10-04 05:02:00 +0000"/> <unit_system data="US"/> </forecast_information> <current_conditions> <condition data="Sunny"/> <temp_f data="88"/> <temp_c data="31"/> <humidity data="Humidity: 49%"/> <icon data="/ig/images/weather/sunny.gif"/> <wind_condition data="Wind: mph"/> </current_conditions> </weather> </xml_api_reply>
【使用DomDocument解析】
<?PHP header("Content-type:text/html; Charset=utf-8"); $url = "http://HdhCmsTestgoogle测试数据/ig/api?weather=shenzhen"; // 加载XML内容 $content = file_get_contents($url); $content = get_utf8_string($content); $dom = DOMDocument::loadXML($content); /* 此处也可使用如下所示的代码, $dom = new DOMDocument(); $dom->load($url); */ $elements = $dom->getElementsByTagName("current_conditions"); $element = $elements->item(0); $condition = get_google_xml_data($element, "condition"); $temp_c = get_google_xml_data($element, "temp_c"); echo '天气:', $condition, '<br />'; echo '温度:', $temp_c, '<br />'; function get_utf8_string($content) { // 将一些字符转化成utf8格式 $encoding = mb_detect_encoding($content, array('ASCII','UTF-8','GB2312','GBK','BIG5')); return mb_convert_encoding($content, 'utf-8', $encoding); } function get_google_xml_data($element, $tagname) { $tags = $element->getElementsByTagName($tagname); // 取得所有的$tagname $tag = $tags->item(0); // 获取第一个以$tagname命名的标签 if ($tag->hasAttributes()) { // 获取data属性 $attribute = $tag->getAttribute("data"); return $attribute; }else { return false; } } ?>
这只是一个简单的示例,仅包括了loadXML, item, getAttribute,getElementsByTagName等方法,还有一些有用的方法,这个依据你的实际需要。 【XMLReader】 当我们要用php解读xml的内容时,有很多物件提供函式,让我们不用一个一个字元去解析,而只要根据标签和属性名称,就能取出文件中的属性与内容了,相较之下方便许多。其中XMLReader循序地浏览过xml档案的节点,可以想像成游标走过整份文件的节点,并抓取需要的内容。 <?PHP header("Content-type:text/html; Charset=utf-8"); $url = "http://HdhCmsTestgoogle测试数据/ig/api?weather=shenzhen"; // 加载XML内容 $xml = new XMLReader(); $xml->open($url); $condition = ''; $temp_c = ''; while ($xml->read()) { // echo $xml->name, "==>", $xml->depth, "<br>"; if (!empty($condition) && !empty($temp_c)) { break; } if ($xml->name == 'condition' && empty($condition)) { // 取第一个condition $condition = $xml->getAttribute('data'); } if ($xml->name == 'temp_c' && empty($temp_c)) { // 取第一个temp_c $temp_c = $xml->getAttribute('data'); } $xml->read(); } $xml->close(); echo '天气:', $condition, '<br />'; echo '温度:', $temp_c, '<br />';
我们只是需要取第一个condition和第一个temp_c,于是遍历所有的节点,将遇到的第一个condition和第一个temp_c写入变量,最后输出。 【DOMXPath】 这种方法需要使用DOMDocument对象创建整个文档的结构, <?PHP header("Content-type:text/html; Charset=utf-8"); $url = "http://HdhCmsTestgoogle测试数据/ig/api?weather=shenzhen"; // 加载XML内容 $dom = new DOMDocument(); $dom->load($url); $xpath = new DOMXPath($dom); $element = $xpath->query("/xml_api_reply/weather/current_conditions")->item(0); $condition = get_google_xml_data($element, "condition"); $temp_c = get_google_xml_data($element, "temp_c"); echo '天气:', $condition, '<br />'; echo '温度:', $temp_c, '<br />'; function get_google_xml_data($element, $tagname) { $tags = $element->getElementsByTagName($tagname); // 取得所有的$tagname $tag = $tags->item(0); // 获取第一个以$tagname命名的标签 if ($tag->hasAttributes()) { // 获取data属性 $attribute = $tag->getAttribute("data"); return $attribute; }else { return false; } } ?>