好得很程序员自学网

<tfoot draggable='sEl'></tfoot>

rails全文索引方案讨论

rails全文索引方案讨论

frederick.mao@gmail.com   ▼   |   Settings   ▼   |   Help   |   Sign out

? 网上论坛首页


Shanghai on Rails



主页

讨论

+ 新帖子

关于此论坛

修改我的会员资格

邀请会员

在 新 Google 网上论坛 中查看此论坛



目前Rails网站全文检索、中文分词一般都用什么方案?

选项





  共 12 个帖子  -  全部折叠    -    将所有内容翻译成 中文(简体)    -   

举报此讨论为垃圾内容




HoLin   查看个人资料       更多选项   7月12日, 下午9时24分

目前Rails网站全文检索、中文分词一般都用什么方案了?  
Google了一下,都是很老的帖子了,好像都不是很好。Javaeye后来也转向lucene了  

有没有Ruby的?简单点,好配置一点 :)  

--  
Regards  
HoLin  

       回复         回复作者           转发            

举报垃圾内容







讨论主题已更改为“回复: [shanghaionrails] 目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:Jason Lee







Jason Lee     查看个人资料       更多选项   7月12日, 下午9时25分

ActiveRecord 的话,可以用 Thinking-sphinx 这个 Gem + Coreseek,很好用的  

------------------------------------------------------  
Jason Lee  
http://huacnlee.com  

在 2011年7月12日星期二,下午9:24,HoLin 写道:  

- 显示引用的文字 -

       回复         回复作者           转发            

举报垃圾内容







讨论主题已更改为“目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:G.zhen.ning







G.zhen.ning   查看个人资料       更多选项   7月12日, 下午9时27分

thinking-sphinx,作者说迟点会支持国人改sphinx的coreseek*.***  

2011/7/12 HoLin <holin ... @gmail.com>  

- 显示引用的文字 -

       回复         回复作者           转发            

举报垃圾内容







讨论主题已更改为“回复: [shanghaionrails] 目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:Jason Lee







Jason Lee     查看个人资料       更多选项   7月12日, 下午9时28分

本来就支持的啊,很容易就搞上去了  

------------------------------------------------------  
Jason Lee  
http://huacnlee.com  

在 2011年7月12日星期二,下午9:27,G.zhen.ning 写道:  

- 显示引用的文字 -

       回复         回复作者           转发            

举报垃圾内容







讨论主题已更改为“目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:Jerry.S







Jerry.S   查看个人资料       更多选项   7月12日, 下午9时31分

Thinking-sphinx. + coreseek  
+1  

发自我的 iPhone  

在 2011-7-12,下午9:27,"G.zhen.ning" <g.zhen.n ... @gmail.com> 写道:  

- 显示引用的文字 -

       回复         回复作者           转发            

举报垃圾内容







HoLin   查看个人资料       更多选项   7月14日, 下午11时21分

用了 Thinking-sphinx. + coreseek + rails3  

Thinking-sphinx取不到sphinx的版本信息,需要修改一下  
Thinking-sphinx。可能是用coreseek返回版本信息不一样的缘故。  

       回复         回复作者           转发            

举报垃圾内容







Michael He     查看个人资料       更多选项   7月15日, 下午2时00分

试试这个,如果你不用innodb的话。  
http://code.google.com/p/mysqlcft/  

2011/7/14 HoLin <holin ... @gmail.com>  

- 显示引用的文字 -

--  
Best  
Michael He  

       回复         回复作者           转发            

举报垃圾内容







Quake Wang   查看个人资料       更多选项   7月15日, 下午4时04分

推荐一下Sunspot:  
http://outoftime.github.com/sunspot/  
他搜索服务器用的是solr(基于Java的Lucene)  

Regards,  
Quake  

2011/7/12 HoLin <holin ... @gmail.com>  

- 显示引用的文字 -

       回复         回复作者           转发            

举报垃圾内容







Michael He     查看个人资料       更多选项   7月15日, 下午4时35分

2011/7/15 Quake Wang <quake.w ... @gmail.com>  

> 推荐一下Sunspot:  
>   http://outoftime.github.com/sunspot/  
> 他搜索服务器用的是solr(基于Java的Lucene)  

支持中文么?  
自动更新索引么?不需要定时任务的。  

- 显示引用的文字 -

--  
Best  
Michael He  

       回复         回复作者           转发            

举报垃圾内容







Quake Wang   查看个人资料       更多选项   7月15日, 下午4时48分

默认支持的中文是单字分词,你可以使用mmseg分词算法:  
http://code.google.com/p/mmseg4j/  
默认是通过ActiveRecord的create/update/destroy callback来更新/删除索引。  

Regards,  
Quake  

2011/7/15 Michael He <hlxw ... @gmail.com>  

- 显示引用的文字 -

       回复         回复作者           转发            

举报垃圾内容







yanqing pei     查看个人资料       翻译成 中文(简体)   更多选项   7月16日, 下午10时38分

coreseek thinking sphinx  

       回复         回复作者           转发            

举报垃圾内容







张光宇   查看个人资料       更多选项   7月19日, 下午12时39分

通过配置sphinx的charset_table和ngram_chars, 足可以对付绝大部分的中英文搜索了。  

如果想用更高级的分词算法,coreseek就派上用场了。代价就是需要编译一个修改过的sphinx,索引速度下降的厉害  

我把我用到的thinking-in-sphinx的config/sphinx.yml文件放上来了:  
rake ts:rebuild即可  
https://gist.github.com/1091302  

--  
Best Regards  

张光宇  
msn: samwisezh ... @hotmail.com 


查看更多关于rails全文索引方案讨论的详细内容...

  阅读:54次