开发者都应该知道的开源搜索引擎

来源:oschina 作者:oschina
  

本文介绍若干款开源搜索引擎,他们具有不同的特性,总之都很强大。对于开发者来说,应该了解。

1、企业搜索解决方案 Constellio

Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 Web 的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。

2、企业搜索解决方案SearchBlox

SearchBlox 是一个企业搜索解决方案,基于 Lucene 构建。可进行快速发布、轻松管理以及支持云环境。这是与 Google Mini 最接近的一款搜索产品。

3、Solr logo 全文搜索服务器 Solr

Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件中使用:<uniqueKey>id</uniqueKey>进行描述。

Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

4、Sphinx logo 全文检索引擎 Sphinx

Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。

Sphinx 单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。

5、Google Search for WordPress

地址http://wordpress.org/extend/plugins/google-search/

如果你想使用 Google search API 运行更快,这个WordPress插件提供了API的实现。

wordPress搜索插件还包括:Search APIRelevanssiSearch EverythingSearch Unleashed

6、其他开源搜索引擎

主页: http://www.dataparksearch.org/ - 是个高性能的开源基于web的搜索引擎,开源许可采用GNU。

URLhttp://www.open-search-server.com/ - 文本搜索引擎,基于开源技术创建,OpenSearchServer是个高性能的软件,你可以嵌入到自己的应用中。

URL: http://openfts.sourceforge.net/ - OpenFTS 是个开源文本搜索引擎,基于PostgreSQL,提供数据在线索引和数据库搜索的相关性排名。 关闭与数据库的集成允许使用元数据来限制搜索结果。

URLhttp://www.elasticsearch.org/ –  Elastic Search具有非常先进的分布式模型,通过本地JSON,拓展很多的高级搜索功能,所有都是通过JSON层显示。

更多见:http://www.oschina.net/project/tag/130/search-engine

原文:http://blog.webdistortion.com/2011/05/29/open-source-search-engines/


 


时间:2011-06-01 08:35 来源:oschina 作者:oschina 原文链接

好文,顶一下
(0)
0%
文章真差,踩一下
(0)
0%
------分隔线----------------------------


把开源带在你的身边-精美linux小纪念品
无觅相关文章插件,快速提升流量