`

solr schema.xml配置总结

    博客分类:
  • solr
 
阅读更多

schema.xml 在solr/conf/目录下,类似于数据表配置文件。

 

 

为了改进性能,可以采取以下几种措施:

1.   将所有只用于搜索的,而不需要作为查询结果的field(特别是一些比较大的field)的stored设置为false。

 

2.   将不需要被用于搜索的,而只是作为查询结果返回的field的indexed设置为false。

 

3.   删除所有不必要的copyField声明,根据需要决定是否进行存储。

 

4.   为了索引字段的最小化和搜索的效率,将所有的 text fields的index都设置成false,然后使用copyField将他们都复制到一个总的 text field上,然后对他进行搜索。

 

5.   使用尽可能高的Log输出等级,减少日志量。可以在solr/admin 中的 LOGGING 进行设置。

 

 

特珠说明:

1.   高高是基于分词的,所有存储需要高亮显示的字段 一定要分词(text)才能高亮显示。

2.   排序字段 是不能当  查询过滤的条件。

 

 

 

文本主要配置项:

 

1.   field 类型定义

      重点是中文分词的添加

 

2.   field 各属性定义

      name     type类型   indexed是否建立索引  stored是否存储 required 是否必填项 multiValued多值存储

 

3.   唯一key

     <uniqueKey>id</uniqueKey>

     文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。

 

4.   默认搜索字段 field

     <defaultSearchField>text</defaultSearchField>

     如果搜索参数中没有指定具体的field,那么这个做为默认的域。

 

5.   搜索参数短语间逻辑

     <solrQueryParser defaultOperator="OR"/>

 

      配置搜索参数短语间的逻辑,可以是"AND|OR"。

      备注: AND是交集,OR是并集

 

6.  复制字段

     <copyField source="content" dest="text"/>

     将多个字段的值 复制至 一个字段中,如果被复制的字段都设置为stored,那个这个字段务必不要设置成stored=true

 

7.  自定义评分器

     <similarity class="......SolrSimilarity"/>

      SolrSimilarity 是继承 DefaultSimilarity的子类,或者实现评分器接口的类。

 

分享到:
评论

相关推荐

    solrconfig.xml和schema.xml说明

    solrconfig.xml和schema.

    schema.xml说明

    solr中的schema.xml说明

    IKAnalyzer-solr4.x-update.zip

    通过继承Analyzer编写自定义类UseSmartIKAnalyzer和NotUseSmartIKAnalyzer,实现智能分词和最细粒度分词,支持solr4.7通过配置schema.xml实现不同的分词效果 &lt;fieldType name="text_ik" class="solr.TextField"&gt; ...

    ik-analyzer-solr7.zip

    3. 配置Solr的`managed-schema`,添加`ik分词器`,示例如下; ```console &lt;!-- ik分词器 --&gt; &lt;fieldType name="text_ik" class="solr.TextField"&gt; &lt;tokenizer class="org.wltea.analyzer.lucene....

    基于java-solr-geo空间坐标搜索、距离排序、分页

    基于solr-geo空间搜索 1、Solr的schema.xml配置 定义坐标field 2、Solr的data-config.xml配置 建立索引 3、java查询语法 坐标距离、分页、排序

    solar1.4环境配置

    solr-1.4.1 环境配置: 1、 下载所需软件,安装配置...在X:\solr\solr\conf当中有schema.xml文件,可以配置索引数据格式。 5、运行solr 启动Tomcat,访问http://localhost:8983 6、添加索引 7、添加中文分词

    支持solr 5.3.0的IKAnalyzer中文分词器

    附上IK在schema.xml中的配置: &lt;fieldType name="text_ik" class="solr.TextField"&gt; &lt;analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/&gt; ...

    solr基础知识介绍

    5.1 schema.xml 9 5.1.1 文件分析 9 5.1.2 文档注释 13 5.2 solrconfig.xml 16 6.Solr缓存 18 6.1 filterCache 18 6.2 queryResultCache 18 6.3 documentCache 19 7.solrj wiki 19 7.1 SolrJ/Solr cross-version ...

    已编译版本solr-8.11.2.tgz

    并对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置,可扩展并对查询性能进行了优化,提供了一个完善的功能管理页面,是一款非常优秀的全文搜索引擎。 3,solr工作方式 文档通过http利用xml加...

    solr所需资源下载(数据导入、分词器、数据库连接jar、配置文件、managed-schema)

    包括solr的所有资源文件文件清单如下: IKAnalyzer.cfg.xml ik-analyzer-solr5-5.x.jar ...managed-schema mysql-connector-java-5.1.7-bin.jar solrconfig.xml data-config.xml ext.dic stopword.dic

    SOLR的应用教程

    2 Solr的安装与配置 13 2.1 在Tomcat下Solr安装 13 2.1.1 安装准备 13 2.1.2 安装过程 14 2.1.3 验证安装 15 2.2 中文分词配置 15 2.2.1 mmseg4j 15 2.2.2 paoding 19 2.3 多核(MultiCore)配置 22 2.3.1 MultiCore...

    tomcat集成solr服务器以及配置好了中文分词器

    只需要解压然后启动tomcat即可访问solr服务器,需要自行在apache-tomcat-solr-7.0.52\webapps\solr\solrhome\collection1\conf\schema.xml修改适合自己的配置的域即可

    ansj分词jar包

    solr配置ansj,managed-schema.xml中配置 &lt;fieldType name="text_ansj" class="solr.TextField" positionIncrementGap="100"&gt; &lt;tokenizer class="org.ansj.lucene.util.AnsjTokenizerFactory" isQuery="false"/...

    solr全文检索

    里面有关于solr环境搭建的详细文档说明,还有schema.xml,solrconfig.xml这两个文件里的配置说明,还有创建索引,删除索引的代码。及性能的优化。

    IKAnalyzer2012FF_u1

    3、在 盘符:\solr\home\collection1\conf\schema.xml中配置以下配置 &lt;fieldType name="text_ik" class="solr.TextField"&gt; &lt;analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IK...

    Apache-Solr-Reference-Guide-v3.5

    It explains how a Solr schema defines the fields and field types which Solr use to organize data within the document files it indexes. : This section explains how Solr prepares Understanding ...

    SearchSchemer:适用于Solr,Elasticsearch和Sensei的多向模式转换器

    -outputFile --outputType其中: inputFile-要读取的配置文件inputType-输入配置类型outputFile-输出配置文件outputType-输出配置类型inputType和outputType属性可以采用以下值: solr-用于Solr schema.xml elastic...

    django-haystack-solr-commands:manage.py solr

    Solr 5.0.0易于使用云核心和自动托管模式进行部署,但无需复制任何schema.xml文件。 Solr 5.0.0可以使用Schema REST API编辑核心的配置。 Solr 5.0.0打破了Haystack版本2.3.1,因为默认情况下它使用托管模式,并且...

    ikanalyzer分词器

    ik-analyzer.jar的类库和schema.xml配置

    Mining Solr In Action源代码

    针对Minging Solr in Action原版书的所有相关源代码示例及所有有关schema.xml, solrconfig.xml的详细配置示例,可以直接运行,配合教程再运行源代码更有助于深入理解、掌握solr全面知识点。

Global site tag (gtag.js) - Google Analytics