gpt4 book ai didi

hadoop - "Hadoop-Solr Lucidworks Project"检索输入名称路径

转载 作者:可可西里 更新时间:2023-11-01 14:30:37 26 4
gpt4 key购买 nike

我正在使用这个项目:https://github.com/lucidworks/hadoop-solr有谁知道在哪个值中保存了正在处理的文档的名称(或路径)。我想将此值检索到 Solr Admin(将一个字段及其名称添加到我的架构中)。这可能吗?

示例:我希望能够看到文档的名称,查询从中返回相同的结果。

我正在使用此命令运行项目:

    hadoop jar solr-hadoop-job-2.2.5.jar 
com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true -DcsvDelimiter=
-cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1
- i /usr/local/hadoop/input
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
-s http://127.0.1.1:8983/solr

最佳答案

这对我有用:

hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob  
-Dlww.commit.on.close=true
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\\w+"
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss
-cls com.lucidworks.hadoop.ingest.RegexIngestMapper
-c collection1 -i /path/* -s http://127.0.1.1:8983/solr
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat

另见 this了解更多信息。

关于hadoop - "Hadoop-Solr Lucidworks Project"检索输入名称路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39598215/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com