昨天小数据量测试通过,查询效率还不错

今天准备了2000万的数据,估计全部索引完得好几天了

开了10进程同时索引中

PS:Zend_Search_Lucene的使用还是很方便的,不过就是文档太缺了

================

update:2008-06-26

测试效果不怎么理想,Lucene的索引更适合一次索引,永远不变的情况

更新索引,再优化,速度非常的慢

目前索引大小1.5G,进行更新,再优化,整整花了1天多的时间

: http://blog.dayuer.com/archives/2008/05/29/335.html

I want to say something ...

Login , Register

4 Comments

  1. No.1 dos2000 :
    6月 26th, 2008 at 12:27 下午

    效率如何呀?难道1个月了还没索引完?

  2. No.2 feng :
    7月 27th, 2008 at 1:37 上午

    博主好,我最近也在研究Zend_Search_Lucene
    这个东西真的是太慢了哦
    我做1000条索引(包括优化)耗时70秒
    做30w条索引,要10个多小时
    不知道你的效率如何?

    另外我想知道一下你是用了什么分词的?网上能找到给Zend_Search_Lucene用的中文分词都是二元分词法,分出来的效果不理想
    我是用了dedecms的分词来做的

  3. No.3 大鱼儿 :
    7月 27th, 2008 at 1:44 上午

    老实说,效率非常的差,不过具体的参数我没有测试
    zend的这玩意也就只适合一次性的索引

    我用的是商用的分词系统,效果还是可以保证的。

  4. No.4 feng :
    8月 11th, 2008 at 2:33 下午

    谢谢:)
    我还以为是我哪里没弄对导致速度这么慢呢