网址为:http://www.webdatacommons.org/
WebDataCommons 世界上最大的网页元数据库(RDFa, Microdata and Microformats),数据从Common Crawl里提取,目前已经从35亿网页里提取了1280亿的链接关系,所有数据资源免费下载