rails全文索引方案讨论
frederick.mao@gmail.com ▼ | Settings ▼ | Help | Sign out
? 网上论坛首页
Shanghai on Rails
主页
讨论
+ 新帖子
关于此论坛
修改我的会员资格
邀请会员
在 新 Google 网上论坛 中查看此论坛
目前Rails网站全文检索、中文分词一般都用什么方案?
选项
共 12 个帖子 - 全部折叠 - 将所有内容翻译成 中文(简体) -
举报此讨论为垃圾内容
HoLin 查看个人资料 更多选项 7月12日, 下午9时24分
目前Rails网站全文检索、中文分词一般都用什么方案了?
Google了一下,都是很老的帖子了,好像都不是很好。Javaeye后来也转向lucene了
有没有Ruby的?简单点,好配置一点 :)
--
Regards
HoLin
回复 回复作者 转发
举报垃圾内容
讨论主题已更改为“回复: [shanghaionrails] 目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:Jason Lee
Jason Lee 查看个人资料 更多选项 7月12日, 下午9时25分
ActiveRecord 的话,可以用 Thinking-sphinx 这个 Gem + Coreseek,很好用的
------------------------------------------------------
Jason Lee
http://huacnlee.com
在 2011年7月12日星期二,下午9:24,HoLin 写道:
回复 回复作者 转发
举报垃圾内容
讨论主题已更改为“目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:G.zhen.ning
G.zhen.ning 查看个人资料 更多选项 7月12日, 下午9时27分
thinking-sphinx,作者说迟点会支持国人改sphinx的coreseek*.***
2011/7/12 HoLin <holin ... @gmail.com>
回复 回复作者 转发
举报垃圾内容
讨论主题已更改为“回复: [shanghaionrails] 目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:Jason Lee
Jason Lee 查看个人资料 更多选项 7月12日, 下午9时28分
本来就支持的啊,很容易就搞上去了
------------------------------------------------------
Jason Lee
http://huacnlee.com
在 2011年7月12日星期二,下午9:27,G.zhen.ning 写道:
回复 回复作者 转发
举报垃圾内容
讨论主题已更改为“目前Rails网站全文检索、中文分词一般都用什么方案?" 作者:Jerry.S
Jerry.S 查看个人资料 更多选项 7月12日, 下午9时31分
Thinking-sphinx. + coreseek
+1
发自我的 iPhone
在 2011-7-12,下午9:27,"G.zhen.ning" <g.zhen.n ... @gmail.com> 写道:
回复 回复作者 转发
举报垃圾内容
HoLin 查看个人资料 更多选项 7月14日, 下午11时21分
用了 Thinking-sphinx. + coreseek + rails3
Thinking-sphinx取不到sphinx的版本信息,需要修改一下
Thinking-sphinx。可能是用coreseek返回版本信息不一样的缘故。
回复 回复作者 转发
举报垃圾内容
Michael He 查看个人资料 更多选项 7月15日, 下午2时00分
试试这个,如果你不用innodb的话。
http://code.google.com/p/mysqlcft/
2011/7/14 HoLin <holin ... @gmail.com>
Best
Michael He
回复 回复作者 转发
举报垃圾内容
Quake Wang 查看个人资料 更多选项 7月15日, 下午4时04分
推荐一下Sunspot:
http://outoftime.github.com/sunspot/
他搜索服务器用的是solr(基于Java的Lucene)
Regards,
Quake
2011/7/12 HoLin <holin ... @gmail.com>
回复 回复作者 转发
举报垃圾内容
Michael He 查看个人资料 更多选项 7月15日, 下午4时35分
2011/7/15 Quake Wang <quake.w ... @gmail.com>
> 推荐一下Sunspot:
> http://outoftime.github.com/sunspot/
> 他搜索服务器用的是solr(基于Java的Lucene)
自动更新索引么?不需要定时任务的。
--
Best
Michael He
回复 回复作者 转发
举报垃圾内容
Quake Wang 查看个人资料 更多选项 7月15日, 下午4时48分
默认支持的中文是单字分词,你可以使用mmseg分词算法:
http://code.google.com/p/mmseg4j/
默认是通过ActiveRecord的create/update/destroy callback来更新/删除索引。
Regards,
Quake
2011/7/15 Michael He <hlxw ... @gmail.com>
回复 回复作者 转发
举报垃圾内容
yanqing pei 查看个人资料 翻译成 中文(简体) 更多选项 7月16日, 下午10时38分
coreseek thinking sphinx
回复 回复作者 转发
举报垃圾内容
张光宇 查看个人资料 更多选项 7月19日, 下午12时39分
通过配置sphinx的charset_table和ngram_chars, 足可以对付绝大部分的中英文搜索了。
如果想用更高级的分词算法,coreseek就派上用场了。代价就是需要编译一个修改过的sphinx,索引速度下降的厉害
我把我用到的thinking-in-sphinx的config/sphinx.yml文件放上来了:
rake ts:rebuild即可
https://gist.github.com/1091302
--
Best Regards
张光宇
msn: samwisezh ... @hotmail.com