schema.xml 在solr/conf/目录下,类似于数据表配置文件。
为了改进性能,可以采取以下几种措施:
1. 将所有只用于搜索的,而不需要作为查询结果的field(特别是一些比较大的field)的stored设置为false。
2. 将不需要被用于搜索的,而只是作为查询结果返回的field的indexed设置为false。
3. 删除所有不必要的copyField声明,根据需要决定是否进行存储。
4. 为了索引字段的最小化和搜索的效率,将所有的 text fields的index都设置成false,然后使用copyField将他们都复制到一个总的 text field上,然后对他进行搜索。
5. 使用尽可能高的Log输出等级,减少日志量。可以在solr/admin 中的 LOGGING 进行设置。
特珠说明:
1. 高高是基于分词的,所有存储需要高亮显示的字段 一定要分词(text)才能高亮显示。
2. 排序字段 是不能当 查询过滤的条件。
文本主要配置项:
1. field 类型定义
重点是中文分词的添加
2. field 各属性定义
name type类型 indexed是否建立索引 stored是否存储 required 是否必填项 multiValued多值存储
3. 唯一key
<uniqueKey>id</uniqueKey>
文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。
4. 默认搜索字段 field
<defaultSearchField>text</defaultSearchField>
如果搜索参数中没有指定具体的field,那么这个做为默认的域。
5. 搜索参数短语间逻辑
<solrQueryParser defaultOperator="OR"/>
配置搜索参数短语间的逻辑,可以是"AND|OR"。
备注: AND是交集,OR是并集
6. 复制字段
<copyField source="content" dest="text"/>
将多个字段的值 复制至 一个字段中,如果被复制的字段都设置为stored,那个这个字段务必不要设置成stored=true
7. 自定义评分器
<similarity class="......SolrSimilarity"/>
SolrSimilarity 是继承 DefaultSimilarity的子类,或者实现评分器接口的类。
分享到:
相关推荐
solrconfig.xml和schema.
solr中的schema.xml说明
通过继承Analyzer编写自定义类UseSmartIKAnalyzer和NotUseSmartIKAnalyzer,实现智能分词和最细粒度分词,支持solr4.7通过配置schema.xml实现不同的分词效果 <fieldType name="text_ik" class="solr.TextField"> ...
3. 配置Solr的`managed-schema`,添加`ik分词器`,示例如下; ```console <!-- ik分词器 --> <fieldType name="text_ik" class="solr.TextField"> <tokenizer class="org.wltea.analyzer.lucene....
基于solr-geo空间搜索 1、Solr的schema.xml配置 定义坐标field 2、Solr的data-config.xml配置 建立索引 3、java查询语法 坐标距离、分页、排序
solr-1.4.1 环境配置: 1、 下载所需软件,安装配置...在X:\solr\solr\conf当中有schema.xml文件,可以配置索引数据格式。 5、运行solr 启动Tomcat,访问http://localhost:8983 6、添加索引 7、添加中文分词
附上IK在schema.xml中的配置: <fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> ...
5.1 schema.xml 9 5.1.1 文件分析 9 5.1.2 文档注释 13 5.2 solrconfig.xml 16 6.Solr缓存 18 6.1 filterCache 18 6.2 queryResultCache 18 6.3 documentCache 19 7.solrj wiki 19 7.1 SolrJ/Solr cross-version ...
并对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置,可扩展并对查询性能进行了优化,提供了一个完善的功能管理页面,是一款非常优秀的全文搜索引擎。 3,solr工作方式 文档通过http利用xml加...
包括solr的所有资源文件文件清单如下: IKAnalyzer.cfg.xml ik-analyzer-solr5-5.x.jar ...managed-schema mysql-connector-java-5.1.7-bin.jar solrconfig.xml data-config.xml ext.dic stopword.dic
2 Solr的安装与配置 13 2.1 在Tomcat下Solr安装 13 2.1.1 安装准备 13 2.1.2 安装过程 14 2.1.3 验证安装 15 2.2 中文分词配置 15 2.2.1 mmseg4j 15 2.2.2 paoding 19 2.3 多核(MultiCore)配置 22 2.3.1 MultiCore...
只需要解压然后启动tomcat即可访问solr服务器,需要自行在apache-tomcat-solr-7.0.52\webapps\solr\solrhome\collection1\conf\schema.xml修改适合自己的配置的域即可
solr配置ansj,managed-schema.xml中配置 <fieldType name="text_ansj" class="solr.TextField" positionIncrementGap="100"> <tokenizer class="org.ansj.lucene.util.AnsjTokenizerFactory" isQuery="false"/...
里面有关于solr环境搭建的详细文档说明,还有schema.xml,solrconfig.xml这两个文件里的配置说明,还有创建索引,删除索引的代码。及性能的优化。
3、在 盘符:\solr\home\collection1\conf\schema.xml中配置以下配置 <fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IK...
It explains how a Solr schema defines the fields and field types which Solr use to organize data within the document files it indexes. : This section explains how Solr prepares Understanding ...
-outputFile --outputType其中: inputFile-要读取的配置文件inputType-输入配置类型outputFile-输出配置文件outputType-输出配置类型inputType和outputType属性可以采用以下值: solr-用于Solr schema.xml elastic...
Solr 5.0.0易于使用云核心和自动托管模式进行部署,但无需复制任何schema.xml文件。 Solr 5.0.0可以使用Schema REST API编辑核心的配置。 Solr 5.0.0打破了Haystack版本2.3.1,因为默认情况下它使用托管模式,并且...
ik-analyzer.jar的类库和schema.xml配置
针对Minging Solr in Action原版书的所有相关源代码示例及所有有关schema.xml, solrconfig.xml的详细配置示例,可以直接运行,配合教程再运行源代码更有助于深入理解、掌握solr全面知识点。