Wikipedia API信息框

我正在使用维基百科API从特定页面获取信息框。 一个例子是伦敦帝国理工学院我的问题是我得到的HESA student population|INSTID=0132 。 我希望刚刚得到的学生人数,而是我得到上面的id。 我如何获得页面中信息框的值?

此外,如果你检查维基页面有两个信息框(主要和排名)。 我怎么能得到他们两个?

您可以使用其他REST API访问wikipedia内容。 要获得文章的结构良好的HTML,您可以要求:

https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London

HTML由Parsoid服务生成,它遵循DOM Spec生成HTML / RDFa内容。 收件箱将是类信息框的html table元素,因此您可以轻松find页面上的所有收件箱。

收件箱通常是由复杂的模板创build的,因此您可以更轻松地parsing表格HTML。