使用
PHP检测文件的MIME类型是微不足道的 – 只需在Unix机器上使用PEAR的
MIME_Type软件包,PHP的
fileinfo或调用文件-i即可.
这对于二进制文件以及具有某种“魔术字节”的所有其他文件非常有效,通过它们可以轻松地检测到它们.
这对于二进制文件以及具有某种“魔术字节”的所有其他文件非常有效,通过它们可以轻松地检测到它们.
我失败的是检测纯文本文件的正确MIME类型:
> CSS
>差异
> INI(配置)
> Javascript
> rST
> sql
所有这些都被标识为“text / plain”,这是正确的,但对我来说太不明确了.我需要真正的类型,即使花费一些时间来分析文件内容.
所以我的问题:有哪些解决方案来检测此类纯文本文件的MIME类型?任何图书馆?代码片段?
如果我使用ruby,我可以集成github’s linguist. Ohloh的ohcount是用C编写的,但有一个命令行工具来检测类型:ohcount -d $file
我试过的
ohcount
阿帕奇蒂卡
检测xml和html,所有其他测试文件只被视为text / plain.
我认为Apache Tika的魔法检测可以帮助你: