自然语言处理 : Get 5 best candidates from QuestionAnsweringPipeline-6ren

自然语言处理 : Get 5 best candidates from QuestionAnsweringPipeline

转载作者：行者123 更新时间：2023-12-05 05:01:47

27

4

我正在使用 huggingface transformers 库开发法语问答模型。我使用的是预训练的 CamemBERT 模型，它与 RoBERTa 非常相似，但适用于法语。

目前，我能够使用 transformers 库中的 QuestionAnsweringPipeline 为我自己的文本问题获得最佳候选答案。

这是我的代码的摘录。

QA_model = "illuin/camembert-large-fquad"
CamTokQA = CamembertTokenizer.from_pretrained(QA_model)
CamQA = CamembertForQuestionAnswering.from_pretrained(QA_model)

device_pipeline = 0 if torch.cuda.is_available() else -1
q_a_pipeline = QuestionAnsweringPipeline(model=CamQA,
                                         tokenizer=CamTokQA,
                                         device=device_pipeline)

ctx = open("text/Sample.txt", "r").read()
question = 'Quel est la taille de la personne ?'
res = q_a_pipeline({'question': question, 'context': ctx})
print(res)

我目前得到这个:{'score': 0.9630325870663725, 'start': 2421, 'end': 2424, 'answer': '{21'} ，这是错误的。

因此，我想获得 5 个最佳候选答案。有谁知道如何做到这一点？

最佳答案

调用管道时，您可以通过topk 参数指定结果数。例如，对于五个最可能的答案:

res = q_a_pipeline({'question': question, 'context': ctx}, topk=5)

这将生成字典列表:[{'score': 0.0013586128421753108, 'start': 885, 'end': 896, 'answer': "L'ingénieur"}, {'score' : 0.0011120906285982946, 'start': 200, 'end': 209, 'answer': 'français.'}, {'score': 0.00010808186718235663, 'start': 164, 'end': 209, 'answer': 'ingénieur hydraulien et essayiste français.'}, {'score': 5.0453970530228015e-05, 'start': 153, 'end': 209, 'answer': 'urbaniste, ingénieur hydraulien et essayiste français.'}, {'score' : 4.455333667193265e-05, 'start': 190, 'end': 209, 'answer': 'essayiste français.'}]

当您查看 code ，您可以看到 QuestionAnsweringPipeline 接受一个名为 topk 的参数。

关于自然语言处理 : Get 5 best candidates from QuestionAnsweringPipeline，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62591068/

27

4

0

文章推荐：松弛错误 : failed with the error "invalid_blocks"

文章推荐： amazon-kinesis - AWS kinesis中的 'Lease'到底是什么

文章推荐： python - 如何索引张量并更改值

.net - 如何确定文档的(自然)语言？
我有一套使用两种语言的文档:英语和德语。关于这些文档没有可用的元信息，程序只能查看其内容。基于此，程序必须决定用哪种语言编写文档。是否有可以在几个小时内实现的针对该问题的“标准”算法？或者，一个免费
c++ - 适合无符号(自然)数的任何值的宽度
背景我有一个日志系统，可以将记录输出到 std::ostream .每条记录都用一个计数器进行注释，该计数器随着每个输出而增加 1，如下所示: ===== Batch # 5 ===== T
java - 从字符串中提取所有(自然)数字的最有效方法
用户可能希望根据需要分隔数字。从字符串中提取所有(自然)数字的最有效(或简单的标准函数)是什么？最佳答案您可以使用正则表达式。我从 Sun's regex matcher tutorial 修改
database - 一个表可以有一个没有(自然)备用键的代理键吗？
我认为如果表有代理键而没有(自然)替代键是没有意义的(请记住，代理键的属性之一是它在数据库之外没有意义环境)。例如假设我有下表: 假设 employee_id 是代理主键，表中没有(自然)备用键。
android - 将屏幕方向锁定为其(自然)默认方向
我想将屏幕方向锁定为其默认方向。我在实现这一点时遇到问题。最初我将屏幕锁定为 list 中的肖像。它适用于纵向默认设备。但是许多平板电脑默认为横向，因此在这些设备中锁定纵向是不合适的，我想检测此默认方
visual-studio-code - vscode中的反向滚动(自然)
我已将笔记本电脑上的触摸板滚动设置为倒置(自然)。它适用于任何地方(pdf、浏览器等)，但在 vscode 中，它坚持正常滚动。通过 vscode 的设置文件没有显示适当的条目。系统:Ubuntu
mongodb - 是提示({$自然: 1}) redundant when using a tailable cursor?
在我发现的许多在上限集合上使用可尾游标的示例中，代码包括: hint( { $natural: 1 } ) (例如 here )，包括官方文档 ( here )，以“确保我们不使用任何索引”，并且结果
flutter - 将 Flutter Row 的子项拉伸(stretch)到最大*自然*高度
@override Widget build(BuildContext context) { return Scaffold( appBar: AppBar( title: T
node.js - 在 Node.js 上训练分类器(自然 - NLP)以查找意外句子
一些上下文:Node.js、Bot、natural module . 我想构建一个机器人，并且我正在使用自然模块来解析用户输入并对其进行总体分类。 var classifier = new natur

首页

博学

6Ren·AI

商城

自然语言处理 : Get 5 best candidates from QuestionAnsweringPipeline