我正在尝试生成一个
XML文件,其中包含一些包含特殊字符的值,例如μmol/ l,x10³cell/μl等等.还需要放入上标的功能.
我使用PHP.net的ordutf8函数将文本μmol/ l编码为类似的东西
μmol/l
function ords_to_unistr($ords,$encoding = 'UTF-8'){ // Turns an array of ordinal values into a string of unicode characters $str = ''; for($i = 0; $i < sizeof($ords); $i++){ // Pack this number into a 4-byte string // (Or multiple one-byte strings,depending on context.) $v = $ords[$i]; $str .= pack("N",$v); } $str = mb_convert_encoding($str,$encoding,"UCS-4BE"); return($str); } function unistr_to_ords($str,$encoding = 'UTF-8'){ // Turns a string of unicode characters into an array of ordinal values,// Even if some of those characters are multibyte. $str = mb_convert_encoding($str,"UCS-4BE",$encoding); $ords = array(); // Visit each unicode character for($i = 0; $i < mb_strlen($str,"UCS-4BE"); $i++){ // Now we have 4 bytes. Find their total // numeric value. $s2 = mb_substr($str,$i,1,"UCS-4BE"); $val = unpack("N",$s2); $ords[] = $val[1]; } return($ords); }
我已成功将此代码转换回“richtext”,使用PHPExcel生成Excel文档和PDF,但我现在需要将其放入XML中.
如果我按原样使用&#字符,我会收到一条错误消息
SimpleXMLElement::addChild(): invalid decimal character value
以下是我在数据库中需要使“XML”友好的更多值
x10<sup>6</sup> cells/µl
从x103细胞/μl转换而来
这里不需要编码这些字符. XML字符串可以使用UTF-8或其他编码.根据编码,序列化器将根据需要进行编码.
$foo = new SimpleXmlElement('<?xml version="1.0" encoding="UTF-8"?><foo/>'); $foo->addChild('bar','μmol/l,x10³ cells/µl'); echo $foo->asXml();
输出(未编码的特殊字符):
<?xml version="1.0" encoding="UTF-8"?> <foo><bar>μmol/l,x10³ cells/µl</bar></foo>
要强制实体使用特殊字符,您需要更改编码:
$foo = new SimpleXmlElement('<?xml version="1.0" encoding="ASCII"?><foo/>'); $foo->addChild('bar',x10³ cells/µl'); echo $foo->asXml();
输出(特殊字符编码):
<?xml version="1.0" encoding="ASCII"?> <foo><bar>μmol/l,x10³ cells/µl</bar></foo>
我建议你将自定义编码转换回UTF-8.这样,XML Api可以处理它.如果您想使用自定义编码存储字符串,则需要在a bug左右工作.
类似x10<su的字符串会触发SimpleXML / DOM中的错误. SimpleXMLElement :: addChild()和DOMDocument :: createElement()的第二个参数有一个断开的转义.您需要将内容创建为文本节点并附加它.
这是一个扩展SimpleXMLElement的小类,并添加了一个解决方法:
class MySimpleXMLElement extends SimpleXMLElement { public function addChild($nodeName,$content = NULL) { $child = parent::addChild($nodeName); if (isset($content)) { $node = dom_import_simplexml($child); $node->appendChild($node->ownerDocument->createTextNode($content)); } return $child; } } $foo = new MySimpleXmlElement('<?xml version="1.0" encoding="UTF-8"?><foo/>'); $foo->addChild('bar','x10<su'); echo $foo->asXml();
输出:
<?xml version="1.0" encoding="UTF-8"?> <foo><bar>&#120&#49&#48&#60&#115&#117</bar></foo>
&来自您的自定义编码作为实体& amp; – 因为它是XML中的特殊字符. XML解析器将对其进行解码.
$xml = <<<'XML' <?xml version="1.0" encoding="UTF-8"?> <foo><bar>&#120&#49&#48&#60&#115&#117</bar></foo> XML; $foo = new SimpleXMLElement($xml); var_dump((string)$foo->bar);
输出:
string(27) "x10<su"