我希望使用wikionary API获得所选单词的含义.
内容检索数据应该与“当天的词”中提供的相同,只有没有etympology,同义词等的基本含义.
例如
内容检索数据应该与“当天的词”中提供的相同,只有没有etympology,同义词等的基本含义.
例如
“postiche n
头部或脸部佩戴的任何假发,如假胡须或假发.“
我试过使用文档,但我可以找到类似的例子,任何人都可以帮助解决这个问题吗?
解决方法
虽然MediaWiki有一个API(api.PHP),但如果您只想检索一个修订版的源代码(不包含在
XML,JSON中,最简单的话)就可以使用action = raw参数到index.PHP.等,而不是API).
例如,这是11月14日日期页面的原始单词:
http://en.wiktionary.org/w/index.php?title=Wiktionary:Word_of_the_day/November_14&action=raw
不幸的是,wiki页面的格式集中在表示(对于人类阅读器)而不是语义(对于机器),所以你不应该对没有“get word definition”API命令感到惊讶.相反,您的脚本必须理解维基编辑人员创建和使用的众多文本格式模板,以及复杂的表示格式语法,包括标题,无序列表等.例如,以下是“溢出”页面的源代码:
http://en.wiktionary.org/w/index.php?title=overflow&action=raw
API中有一个“生成XML解析树”选项,但它不会将大部分表示格式化为XML.亲自看看:
如果您想知道MediaWiki以外的MediaWiki格式页面是否存在解析器,请不要.至少没有用JavaScript编写的任何内容(参见list of alternative parsers,并查看列出的两个网站).即使这样,支持大多数/所有常见模板也将是一个巨大的挑战.祝好运.