phpsolr中文 php str_split中文

很多站长朋友们都不太清楚phpsolr中文，今天小编就来给大家整理phpsolr中文，希望对各位有所帮助，具体内容如下：

本文目录一览： 1、在windows系统上，solr中怎么配置中文分析器 2、 solr 服务器怎么实现拼音搜索中文，类似百度搜索框的，输入拼音自动匹配中文，是用了插件还是？ 3、 solr5.5需要配置中文分析吗 4、 solr php里中文分词怎么用 5、教你使用solr搭建你的全文检索 6、 solr的中文是什么意思在windows系统上，solr中怎么配置中文分析器

1、安装libssstrong扩展带dll的就是windows用的。根据自己的环境选择安装包。这里选择的是5.5ThreadSafe(TS)x64解压完后，会有三个文件，libssstrong.dll、php_ssh.dll、php_ssstrong.pdb。将php_ssh.dll、php_ssstrong.pdb放到你的php扩展目录下php/ext/下。将libssstrong.dll复制到c:/windows/system32和c:/windows/syswow64各一份php.ini中加入extension=php_ssstrong.dll重启服务器，查看phpinfo()，是否有显示php_ssstrong扩展加载成功。2、安装solr扩展（2.3.0）下载，带dll的就是windows版的。将压缩包的php_solr.dll、php_solr.pdb放到你的php扩展目录下php/ext/下。php.ini中加入extension=php_solr.dll重启服务器，查看phpinfo()，是否有显示solr扩展加载成功。

solr 服务器怎么实现拼音搜索中文，类似百度搜索框的，输入拼音自动匹配中文，是用了插件还是？

这个是使用了一个数据库，将常用的匹配词收集整理，然后输入数据库，就像搜狗拼音输入法一样，有个常用词汇。这个都是特意收集整理的。

solr5.5需要配置中文分析吗

需要。

在solr中默认是中文分析器，需要手工配置。配置一个FieldType，在FieldType中指定中文分析器。

1、使用 IK-Analyzer中文分析器将该分析器文件上传服务器 /opt/tools/IK Analyzer 2012FF_hf1

2、将需要把分析器的jar包（IKAnalyzer2012FF_u1.jar）添加到solr工程中。

[root@localhost IK Analyzer 2012FF_hf1]# cp IKAnalyzer2012FF_u1.jar /usr/local/solr4/tomcat7/webapps/solr/WEB-INF/lib/

3、把IKAnalyzer需要的扩展词典及停用词词典、配置文件复制到solr工程的classpath。

(1) 在usr/local/solr4/tomcat7/webapps/solr/WEB-INF/目录下创建classes目录 [root@localhost WEB-INF]# mkdir classes

(2)复制文件 [root@localhost IK Analyzer 2012FF_hf1]# cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr4/tomcat7/webapps/solr/WEB-INF/classes

ext_stopword.dic：扩展词词典

mydict.dic：停用词词典

注意：扩展词典及停用词词典的字符集必须是utf-8。不能使用windows记事本编辑。

4、配置fieldType。需要在solrhome/collection1/conf/schema.xml中配置。技巧：使用vi、vim跳转到文档开头gg。跳转到文档末尾：G

在文件末尾添加fieldType

</fieldType>

name="text_ik"：一个标识可以随便写

class="solr.TextField"：分词分析器

solr php里中文分词怎么用

可以看手册。

希望我的回答可以帮到你，有什么不懂可以追问。

教你使用solr搭建你的全文检索

Solr 是一个可供企业使用的基于 Lucene 的开箱即用的搜索服务器对Lucene不熟？那么建议先看看下面两篇文档

实战Lucene 第部分初识 Lucene lo lucene /

用Lucene加速Web搜索应用程序的开发 lucene /

一 solr介绍

solr是基于Lucene Java搜索库的企业级全文搜索引擎目前是apache的一个项目它的官方网址在 solr需要运行在一个servlet 容器里例如tomcat solr在lucene的上层提供了一个基于HTTP/XML的Web Services 我们的应用需要通过这个服务与solr进行交互

二 solr安装和配置

关于solr的安装和配置这里也有两篇非常好的文档作者同时也是 Lucene Java 项目的提交人和发言人

使用Apache Solr实现更加灵巧的搜索 solr /l

solr /l

下面主要说说需要注意的地方

Solr的安装非常简单下载solr的zip包后解压缩将dist目录下的war文件改名为solr war直接复制到tomcat 的webapps目录即可注意一定要设置solr的主位置有三种方法我采用的是在tomcat里配置java p/env/solr/home的一个JNDI指向solr的主目录（example目录下）建立/tomcat /conf/Catalina/localhost/solr xml文件

观察这个指定的solr主位置里面存在两个文件夹 conf和data 其中conf里存放了对solr而言最为重要的两个配置文件schema xml和solrconfig xml data则用于存放索引文件

schema xml主要包括types fields和其他的一些缺省设置

solrconfig xml用来配置Solr的一些系统属性例如与索引和查询处理有关的一些常见的配置选项以及缓存扩展等等

上面的文档对这两个文件有比较详细的说明非常容易上手注意到schema xml里有一个

的配置这里将url字段作为索引文档的唯一标识符非常重要

三加入中文分词

对全文检索而言中文分词非常的重要这里采用了qieqie庖丁分词（非常不错））集成非常的容易我下载的是 alpha 版本其中它支持最多切分和按最大切分创建自己的一个中文TokenizerFactory继承自solr的BaseTokenizerFactory

/** * Created by IntelliJ IDEA * User: ronghao * Date: * Time: : : * 中文切词对庖丁切词的封装 */ public class ChineseTokenizerFactory extends BaseTokenizerFactory { /** * 最多切分默认模式 */ public static final String MOST_WORDS_MODE = most words ; /** * 按最大切分 */ public static final String MAX_WORD_LENGTH_MODE = max word length ; private String mode = null; public void setMode(String mode) { if (mode==null||MOST_WORDS_MODE equalsIgnoreCase(mode) || default equalsIgnoreCase(mode)) { this mode=MOST_WORDS_MODE; } else if (MAX_WORD_LENGTH_MODE equalsIgnoreCase(mode)) { this mode=MAX_WORD_LENGTH_MODE; } else { throw new IllegalArgumentException( 不合法的分析器Mode 参数设置: + mode); } } @Override public void init(Map args) { super init(args); setMode(args get( mode )); } public TokenStream create(Reader input) { return new PaodingTokenizer(input PaodingMaker make() createTokenCollector()); } private TokenCollector createTokenCollector() { if( MOST_WORDS_MODE equals(mode)) return new MostWordsTokenCollector(); if( MAX_WORD_LENGTH_MODE equals(mode)) return new MaxWordLengthTokenCollector(); throw new Error( never happened ); } }

在schema xml的字段text配置里加入该分词器

< *** yzer type= index >

</ *** yzer>

< *** yzer type= query >

</ *** yzer>

</fieldtype>

完成后重启tomcat 即可在

体验到庖丁的中文分词注意要将paoding *** ysis jar复制到solr的lib下注意修改jar包里字典的home

四与自己应用进行集成

Solr安装完毕现在可以将自己的应用与solr集成其实过程非常的简单应用增加数据——>根据配置的字段构建add的xml文档——>post至solr/update

应用删除数据à根据配置的索引文档唯一标识符构建delete的xml文档——>post至solr/update

检索数据à构建查询xml—>get至/solr/select/——>对solr返回的xml进行处理——>页面展现

具体的xml格式可以在solr网站找到另外就是solr支持高亮显示非常方便

关于中文 solr内核支持UTF 编码所以在tomcat里的server xml需要进行配置

另外向solr Post请求的时候需要转为utf 编码对solr 返回的查询结果也需要进行一次utf 的转码检索数据时对查询的关键字也需要转码然后用 + 连接

String[] array = StringUtils split(query null ); for (String str : array) { result = result + URLEncoder encode(str UTF ) + + ; }

lishixinzhi/Article/program/Java/hx/201311/25984

solr的中文是什么意思

Solr是一个独立的企业级搜索应用服务器，它对外提供类似于Web-service的API接口。

用户可以通过http请求，向搜索引擎服务器提交一定格式的XML文件，生成索引;也可以通过Http Get操作提出查找请求，并得到XML格式的返回结果。

关于phpsolr中文的介绍到此就结束了，不知道本篇文章是否对您有帮助呢？如果你还想了解更多此类信息，记得收藏关注本站，我们会不定期更新哦。

查看更多关于phpsolr中文 php str_split中文的详细内容...

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://haodehen.cn/did209232

更新时间：2023-05-03 阅读：37次