我在寻找一个通用的API /网络服务/工具/等等,让一个给定的HTML页面转换为RDF图尽可能具体(最有可能使用背脊本体和/或映射器)

有帮助吗?

解决方案 2

我用XQuery来提取数据从给定的网页的。我不得不写的网页自定义查询。我认为这是要为一组特定的HTML文件的最直接的方法。然而,这显然是不适合一般情况。对于一组不同的网页都需要其他的自定义查询被写入。

其他提示

你有没有证明 GRDDL

  

GRDDL是用于获得RDF的技术   从XML文档和数据   特定XHTML页面。

我用JSoup从HTML刮数据。它使用查询HTML DOM,至极我已经famirial用,所以这是真的简单的工具来使用我的jQuery的风格。我也资助它相当强劲,但我需要它只是凑3个数据源,所以我没有用这个工具丰富的经验呢。 jsoup

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top