X

横跨教育视野的垂直搜索

搜索网络通常涉及将关键字或短语键入搜索引擎并单击“立即搜索”按钮。这是非常有效的,几家大公司通过向用户提供可搜索到数百万的用户来说,如果不是数十亿的网页,则在这方面突出。但是,根据赫洛特·阿尔托·霍尔托,加利福尼亚州和中国技术公司的研究人员,创新工作,一般搜索引擎,虽然非常有效地追踪信息,但是非结构化,这限制了用户进一步自动化搜索处理的能力结果。

其他研究人员试图找到支持更多精确的网站搜索特定网站的方法,所谓的内容垂直,但在写入 国际计算科学与工程学报,HP的Meichun HSU和IW的Yuhong Xiong解释了一个可用于搜索这种垂直的替代网络搜索系统。他们证明了新系统如何通过关注在线课程。

研究人员指出,在网上的日子里,公司或教育机构内的关系数据库相当于现代在线内容垂直。关系数据库的用户可以将搜索结果嵌入该数据库的应用程序中。惠普团队希望转发此嵌入过程并将其扩展到更广泛的网站。作为这样一种方法的种类的示例,这种方法可能允许他们描述他们希望如何能够执行以下操作:

从hp.com中选择product_name其中product_type pc

想象一下,通过聪明的编程,可以对在线教育资源跨越有关在线教育资源的类似查询,以便他们可以快速且轻松地提取特定的招股说明书,课程,时间表和测试,而不是在域中快速且轻松地测试。为了解决这个问题,该团队已被利用“重点爬行”,其中只有可能相关的页面爬行和索引。这与“Web Content Classification”一致,它将元数据添加到加速搜索的相关页面。最后,“信息提取”从该聚焦和分类数据中取出了重要信息。该团队现在已将这种方法应用于惠普的OFCOURLE项目。

“该技术可用于支持从网络中提取和聚合的内容上的结构化查询,”团队说。 “它们也是个性化的基础,通过对特定用户的感兴趣的网络内容提供更多的见解。”搜索的新方法确实需要在某些阶段进行人为干预,因此每个域内的内容可能更有效地归类,但机器学习方法也可以导致这一过程的一定程度的自动化。该团队表示,将我们联系到“在网络时代的数据库技术和信息检索的融合”的一步。

“用于Web查询的可扩展信息提取” 国际计算科学与工程学报 ,2010年,5,176-184

本网站使用cookie。