Home | Favorite | Sitemap | search
  • 成功栏目导航
  • 成功教育学
  • 成功创业者
  • 成功投资者
  • 成功管理学
  • 成功心理学
  • 领袖栏目导航
  • CEO
  • CFO
  • CIO
  • CTO
  • CKO
  • CHO
  • CMO
  • CNO
  • CQO
  • CBO
  • CCO
  • CVO
  您现在的位置: 成功领袖网 >> 首席技术官CTO >> 技术方案 >> 文章正文
当搜索遇到商业智能 BI搜索有何不同?

    BI搜索有何不同

把搜索范围扩大到BI领域之所以比较容易,原因之一就是用户已经知道了搜索他们熟悉的基于Web的搜索引擎。只要稍加培训,用户就能学会如何使用额外选项,这些选项类似Web引擎上的高级搜索特性里面的选项。

然而,企业搜索背后发生的一切与Web搜索引擎的运作大不相同。如今,大多数Web查询针对的是非结构化数据,譬如HTML、PowerPoint演示文档和PDF文件。因为这些资源面向文档,所以引擎会对数据具有的意义及相关性作出智能决策(网页甚至有特殊标签,以方便这个过程)。

相比之下,结构化数据一般不提供这种上下文信息。打开数据库,看到名为“零件”的一列数字,对这个数指什么(零件号、成本、库存、位置及其他信息)知之甚少。使用元数据最终可以解决这个问题; 通过支持数据库里面的XML,这个问题已得到了解决; 但至于如今绝大部分的结构化数据,根本就没有简单的解决方案。

BI软件通过使用模板以及经过培训的分析人员定义的数据关系,从一方面解决了这个问题。正因为如此,如今的许多企业搜索引擎如Google和X1把搜索结构化数据的任务交给了BI软件,然后把结果与来自搜索索引的条目进行联合(即合并)。

非结构化数据有自己的难题。第一个就是数量巨大。IBM的信息管理战略项目主任Mark Andrews指出,每个企业用户每个工作日通常需要处理(包括收发)70封电子邮件。如果一家公司有25000名员工,那么每年有近5亿封电子邮件需要保存(为了符合法规遵从),而且能够易于搜索。另外还有其他格式的各种文档(HTML、文字处理、电子表格和演示文档),用户会面临严重的存储问题,这本身就是另一大难题。由于许多搜索返回成千上万的结果,如何评定结果的相关性?

Google企业部门的产品主管Matthew Glotzbach说: “不像Web搜索,你通常没有试图蒙骗算法的垃圾邮件发送站点,但也没有大量的使用数据(Web和应用服务器自动收集的有关用户访问行为的日志数据)来指导你。”但Google并没有透露它使用何种算法。

IBM比较愿意透露自己的算法,它在企业搜索中使用混合的权重因子来评定相关性,其中包括: 用户点击模式、某条目在文档中的格式及位置(标题的相关性高于文本里面的条目)以及元数据(链接内文本的评定不同于文档正文内的类似文本)等等。

如今的大多数产品提供了一种方法,可以增加某些文档或者URL的相关性,以便在特定搜索中占据头名位置。(譬如说,“性骚扰”查询经改动后,可以确保公司策略总是返回的第一个条目。)此外,许多产品能够对特定公司的语言进行定制。这样搜索引擎就可以知道: “Region 1”方面的查询是指查询东部安全第一

访问功能是

[1] [2] 下一页

  • 上一篇文章: 详细解析Apache服务器实现的用户验证
  • 下一篇文章: 选择商业化防火墙需要参考的性能指标
  • 【发表评论】【告诉好友】【打印此文】【关闭窗口】
    【网友评论】
    Oracle数据库最大可用性体系结…
    赛门铁克Enterprise Vault可用…
    QA组织的建立
    Adobe也绑定推广Google工具条
    • 【郑重声明】
    • 免责声明:成功领袖网登载此文出于传递信息之目的,绝不意味着成功领袖网赞同其观点或证实其描述。以上内容仅供网友学 习与交流,无意侵犯版权。如有侵犯您的利益,请告知。我们将尽快删除。
    基本信息
    • 作者:佚名
    • 来源:硅谷动力论坛
    • 阅读:
    • 时间:2007-3-7

    相关信息
    • 谷歌推出中文图书搜索 将与学术搜索整合
      曹国伟看重WAP搜索 将力挺新浪爱问?
      Google代码搜索 窥探程序漏洞
      Google搜索有漏洞被钓鱼攻击
      搜索引擎年终大战忙?
      手机搜索:SP的救命稻草?
      首个专业房地产搜索引擎面市
      Google非搜索业务雷声大雨点小
      盖茨:搜索市场,让我们打一场持久战
      “搜索盛世”引发最大规模猎头对抗

    点击排行
    • 推荐文章 QA组织的建立
      普通文章 首个专业房地产搜索引擎面市
      普通文章 中移动杀入即时通讯市场
    评论排行
    • 推荐文章 QA组织的建立
    关于我们 | 联系方式 | 合作伙伴 | 友情链接 | 站点地图 | 网站大事记 | 留言反馈 | 老网站
    为了使本网站能够得到更好的浏览效果,请您使用IE6.0或以上版本浏览 (For better browsing effect,Recommend to use IE6.0 or above)
    版权所有 成功领袖网 www.21cbpc.com 最佳分辨率 1024×768 E-mail:21cbpc@gmail.com 灵意设计全程网络策划 备案序号:粤ICP备05135149号