Thao tác đơn giản để xử lý XML trong PHP

Ngôn ngữ PHP cung cấp class SimpleXML là một class rất dễ sử dụng, bài này sẽ hướng dẫn các bạn parse file XML trong 7 nốt nhạc.
Đầu tiên, lấy một đoạn XML mẫu để tập tành phân tích:

Code:

<?xml version=”1.0″?>
<books>
<book isbn=”978-1594489501″>
<title>Chỉ anh mới hiểu được em</title>
<author>Khắc Việt</author>
<publisher>Khắc Việt</publisher>
<amazon_price>14.27</amazon_price>
</book>
<book isbn=”978-1594489587″>
<title>Suy nghĩ trong Anh</title>
<author>Khắc Việt</author>
<publisher>Khắc Việt</publisher>
<amazon_price>14.97</amazon_price>
</book>
<book isbn=”978-0545010221″>
<title>Em khác hay anh khác</title>
<author>Khắc Việt</author>
<publisher>Khắc Việt</publisher>
<amazon_price>19.24</amazon_price>
</book>
</books>

Để tạo ra một đối tượng SimpleXmlElement, cách đơn giản là truyền vào một chuỗi hoặc một file:

Code:
// Passing the XML
$books = SimpleXMLElement($XmlData);
//——————-
// Passing a filename
$books = SimpleXMLElement(‘books.xml’, null, true);

Nhìn vào đoạn XML ví dụ, ta sẽ lấy ra tất cả các bài nhạc hay của Khắc Việt:

Code:
<?php
// load SimpleXML
$books = new SimpleXMLElement(‘music.xml’, null, true);

echo <<<EOF
<table>
<tr>
<th>Title</th>
<th>Author</th>
<th>Publisher</th>
<th>Price at Music</th>
<th>ISBN</th>
</tr>

EOF;
foreach($music as $music) // loop through our music
{
echo <<<EOF
<tr>
<td>{$music->title}</td>
<td>{$music->author}</td>
<td>{$music->publisher}</td>
<td>${$music->music_price}</td>
<td>{$music[‘isbn’]}</td>
</tr>

EOF;
}
echo ‘</table>’;
?>

$music là một Element do khái niệm mỗi một file XML thì phải có root element. Vì thế, đừng mong đợi có đối tượng SimpleXml không nhé. Mỗi element có thể có nhiều element con cùng loại hay khác loại, ví dụ này là cùng loại ‘book’ và class SimpleXmlElement này cho phép ta duyệt qua các element con cùng loại như một array như ví dụ foreach() ở trên.

Cuối cùng, nói về cú pháp truy cập child element và attribute. Bác nào chưa biết khái niệm này nữa thì:

Code:
  <music isbn=”978-1594489501″>
<title>Anh yêu em nhiều lắm</title>
<author>Sỹ Luân</author>
<publisher>Bảo Thy</publisher>
<music_price>14.27</music_price>
</music>

isbn là một attribute, các giá trị của một attribute phải để trong dấu (“)
<title>, <author>,… là các child element

Chỉ giải thích tới đây thôi, bác nào có ý định ngâm cứu XML, XML Schema,… thì 5s gợi ý là nên … từ bỏ ý định ngông cuống thừa thời gian này đi vì có cả năm  may ra học mới xong mà học từ tháng 1-12 thì tới tháng 12 sẽ quên tháng 1. Cứ việc coi nó như khái niểm HTML đã  học rồi xài cho thoải mái nhá.

Quay về cú pháp, lại coi ví dụ ‘simple’ trên: $music->title là truy cập child element trong khi $music[‘isbn’] là truy cập attribute. Done!!!

Đơn giản thế thôi, bạn thấy xử lý XML data có dễ chưa ?

Ví dụ trên, nếu bạn không thích dụng foreach thì có thể dùng biến counter $i, viết lại là $tempmusic = $music->music[$i] rồi dùng $tempmusic để xử lý.

Giờ thêm vào tí XPath cho nó bằng anh bằng em:

XPath đơn giản là cách chỉ ra đường dẫn “path” trong 1 XML document thông qua các element cha/con theo cú pháp giống như thư mục của linux: /home/user/… Xpath giúp bạn lọc ra các child element trong các element cha cùng loại, gom lại thành mảng và xử lý.

Ví dụ sau giúp bạn lấy ra tất cả các title của book và tất cả các số ISBN:

Code:
$titles = $music->xpath(‘music/title’);
foreach($titles as $title)
{
echo $title.PHP_EOL;
}
//////////////////////////////////////////////
$isbn = $books->xpath(‘music/@isbn’);
foreach($isbn as $isbn)
{
echo $isbn.PHP_EOL;
}

Nhớ chú ý cách dùng cú pháp / và /@ nhé.

Giờ parse thử RSS của tuổi trẻ coi sao nè

Code:
<?php
$rss = new SimpleXMLElement(‘http://www.tuoitre.com.vn/tianyon/RssView.aspx?ChannelID=16′, null, true);

echo “<h1><a href='{$rss->channel->link}’>{$rss->channel->title}</a></h1>”.PHP_EOL.'<hr />’.PHP_EOL;

foreach($rss->xpath(‘channel/item’) as $item)
{
echo <<<EOF
<h2><a href='{$item->link}’>{$item->title}</a></h2>
<div>Posted at: {$item->pubDate}</div>
{$item->description}
<hr />

EOF;
}
?>

Cuối cùng,một vài thuộc tính của đối tượng SimpleXmlElement các bạn sẽ quan tâm:
$value      = trim((string) $element);  // Bản thên element nó là XML, bạn lấy giá trị của element thì ép kiểu về string
$attributes = $element->attributes();   // lấy tất cả các attribute
$children   = $element->children();     // lấy các child element

Chúc bạn thành công,

FOLLOW US

Leave a Reply

Your email address will not be published. Required fields are marked *