php – Google的索引XSLT页面

前端之家收集整理的这篇文章主要介绍了php – Google的索引XSLT页面前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我的站点是使用 XML作为数据存储创建的,而XSLT则用作模板.看来谷歌在基于XML / XSLT的索引网站上并不是很好.是否有任何有效/易于实现的软件组件可以为Google bot索引器呈现XSLT?如果他们使用 PHP,那会更好.
看看PHP XSLT处理器.

http://php.net/manual/en/class.xsltprocessor.php

使用方法如下:

<?PHP 
$sXml  = "<xml>"; 
$sXml .= "<sudhir>hello sudhir</sudhir>"; 
$sXml .= "</xml>"; 

# LOAD XML FILE 
$XML = new DOMDocument(); 
$XML->loadXML( $sXml ); 

# START XSLT 
$xslt = new XSLTProcessor(); 
$XSL = new DOMDocument(); 
$XSL->load( 'xsl/index.xsl',LIBXML_NOCDATA); 
$xslt->importStylesheet( $XSL ); 
#PRINT 
print $xslt->transformToXML( $XML ); 
?>

(自http://php.net/manual/en/book.xsl.php起)

UPDATE

您在评论中询问如何拦截来自特定用户代理(例如Googlebot)的请求.有多种方法可以执行此操作,具体取决于您使用的Web服务器技术.

在Apache上,一种方法是使用mod_rewrite在内部将请求处理转移到包含类似于我们上面看到的代码PHP脚本.此脚本从最初请求的URL中检索XML,并将转换呈现给客户端.重写规则将有一个Rewrite Condition,用于将HTTP_USER_AGENT标头与Google进行比较.这是一个规则的例子(未经测试,但你应该得到这个想法):

RewriteCond %{HTTP_USER_AGENT} ^(.*)Googlebot(.*)$[NC]
RewriteRule ^(.*\.xml.*)$/renderxslt.PHP?url=$1 [L]

简而言之,条件是查找以字符串“googlebot”开头的引荐来源,并且重写规则匹配任何带有字符串“.xml”的URL,并将完整的URL作为查询字符串参数传递给renderxslt.PHP页面.

也是IIS的mod_rewrite exis端口(http://www.isapirewrite.com/).

或者,使用IIS,您可以使用ASP.NET HTTP module拦截请求,再次检查Request.Headers [“HTTP_USER_AGENT”]以获取Google的签名.然后,您可以通过阅读PHP脚本生成的HTML,或者通过使用ASP.NET XML控件来以类似的方式继续前进:

<asp:Xml ID="Xml1" runat="server" DocumentSource="~/cdlist.xml" TransformSource="~/listformat.xsl"></asp:Xml>

猜你在找的PHP相关文章