python - 变形金刚 : Asking to pad but the tokenizer does not have a padding token-6ren

python - 变形金刚 : Asking to pad but the tokenizer does not have a padding token

转载作者：行者123 更新时间：2023-12-02 01:49:01

28

4

尝试使用相同的数据集依次评估一堆 transformers 模型，以检查哪个模型表现更好。

模型列表是这个:

MODELS = [
      ('xlm-mlm-enfr-1024'   ,"XLMModel"),
      ('distilbert-base-cased', "DistilBertModel"),
      ('bert-base-uncased'     ,"BertModel"),
      ('roberta-base'        ,"RobertaModel"),
      ("cardiffnlp/twitter-roberta-base-sentiment","RobertaSentTW"),
      ('xlnet-base-cased'     ,"XLNetModel"),
      #('ctrl'                ,"CTRLModel"),
      ('transfo-xl-wt103'    ,"TransfoXLModel"),
      ('bert-base-cased'       ,"BertModelUncased"),
      ('xlm-roberta-base'     ,"XLMRobertaModel"),
      ('openai-gpt'           ,"OpenAIGPTModel"),
      ('gpt2'                 ,"GPT2Model")

在“ctrl”模型之前，它们都工作正常，它返回此错误:

请求填充，但分词器没有填充 token 。请选择一个代币用作“pad_token”“(tokenizer.pad_token = tokenizer.eos_token e.g.)”或通过“tokenizer.add_special_tokens({'pad_token': '[PAD]'})”添加新的 pad 代币。

对我的数据集的句子进行分词时。

分词代码是

SEQ_LEN = MAX_LEN #(50)

for pretrained_weights, model_name in MODELS:

print("***************** INICIANDO " ,model_name,", weights ",pretrained_weights, "********* ")
print("carganzo el tokenizador ()")
tokenizer = AutoTokenizer.from_pretrained(pretrained_weights)
print("creando el modelo preentrenado")
transformer_model = TFAutoModel.from_pretrained(pretrained_weights)
print("aplicando el tokenizador al dataset")

##APLICAMOS EL TOKENIZADOR##

def tokenize(sentence):
  
  tokens = tokenizer.encode_plus(sentence, max_length=MAX_LEN,
                               truncation=True, padding='max_length',
                               add_special_tokens=True, return_attention_mask=True,
                               return_token_type_ids=False, return_tensors='tf')
  return tokens['input_ids'], tokens['attention_mask']

# initialize two arrays for input tensors
Xids = np.zeros((len(df), SEQ_LEN))
Xmask = np.zeros((len(df), SEQ_LEN))

for i, sentence in enumerate(df['tweet']):
    Xids[i, :], Xmask[i, :] = tokenize(sentence)
    if i % 10000 == 0:
        print(i)  # do this so we can see some progress


arr = df['label'].values  # take label column in df as array

labels = np.zeros((arr.size, arr.max()+1))  # initialize empty (all zero) label array
labels[np.arange(arr.size), arr] = 1  # add ones in indices where we have a value`

我曾尝试按照解决方案告诉我的那样定义填充标记，但随后出现此错误

could not broadcast input array from shape (3,) into shape (50,)

排队

Xids[i, :], Xmask[i, :] = tokenize(sentence)

我也试过this solution并且都不起作用。

如果你能读到这里，谢谢。

需要任何帮助。

最佳答案

您可以使用 add_special_tokens API 添加 [PAD] token 。

tokenizer = AutoTokenizer.from_pretrained(pretrained_weights)
if tokenizer.pad_token is None:
    tokenizer.add_special_tokens({'pad_token': '[PAD]'})

关于python - 变形金刚 : Asking to pad but the tokenizer does not have a padding token，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70544129/

28

4

0

文章推荐： Haskell 嵌套函数顺序

文章推荐： python - 自动计数器作为整数的子类？

html - SVG 变形
我正在尝试在我的网站上嵌入多个 .svg 文件。只要我使用 Chrome、Firefox 或我目前测试过的任何移动浏览器，一切似乎都运行良好。但是，有一个异常(exception):每当我在 Wind
html - SVG 变形
我正在尝试在我的网站上嵌入多个 .svg 文件。只要我使用 Chrome、Firefox 或我目前测试过的任何移动浏览器，一切似乎都运行良好。但是，有一个异常(exception):每当我在 Wind
Java2D - 变形/插入两个形状
是否有某种方法(库或算法)可用于在 java.awt.Shape 或其路径迭代器的两个实例之间进行插值？例如，要在矩形和椭圆之间无缝过渡？或者更一般的 Path2D 情况。最佳答案 SwingX 中
javascript - HTML5 Canvas 变形
我试图在动态大小的视频上包含一个 Canvas 元素，该视频将异步加载。在 Canvas 上，用户将能够拖动矩形选择框并调整其大小。在我的 JS 文件中，我有一个监听器监 window 口，并通过
opengl - 我应该如何处理(变形)opengl中的4D对象？
Closed. This question needs to be more focused。它当前不接受答案。想改善这个问题吗？更新问题，使其仅关注editing this post一个问题。去
python - 使用移位向量进行 GDAL 变形
有没有办法通过 GDAL(使用 Python API)使用移位向量来扭曲图像？通过移位向量，我的意思是例如。包含以下列的 CSV(或 numpy)文件:starting_x,starting_y,t
ios - 使用 CoreAnimation 变形
我正在创建一个导航按钮。当用户按下它时，按钮的图像应该改变，反射(reflect)它的状态(例如菜单打开/关闭)。我决定为此做一个 morphing-liek 动画。可以用CoreAnimation来
python - 如何根据另一列的每组最大值将一列的标签分配给新的标签？ Pandas 变形
我在 Pandas 中有以下示例数据框。如何获取每个 'Id' 的 'label_weight' 值的最大值并将相应的 'label' 列分配给该 'Id' 在新列 'assgined_label'
html - 文本使我的 div 变形
文本使我的框变形。这是我的: This text is deforming the "leftOne" 还有 CSS: .leftOne { float: left;
html - CSS水平菜单使用无序列表 flex 变形
HTML: Home Services About Us Contact Us CSS: ul { pa
image - 变形 2 面图像
我想在这里得到 openCV 爱好者的帮助。我想知道关于如何变形 2 个面孔的方向(以及一些建议或代码段)，以及一种比率，即第一个面孔的 10% 和第二个面孔的 90%。我见过像 cvWarpAf
python - 脸部变形/变形 - 周围没有框架？
我已经搜索了很长时间，但还没有找到真正的答案，但是，也许我的眼睛上有西红柿，但是真的没有针对 python/MATLAB 的框架可以进行面部扭曲/开箱即用？一个框架，我在其中放入两张带有特征点的图像
android - Material FAB 变形
根据material.io float 操作按钮可以变身为操作菜单，如 this .有什么方法可以只使用 Material 库(没有第三方库)吗？我试过了this库，但它会在菜单关闭后根据底部应用栏
cocoa - -setWantsLayer 导致 NSOpenGLView 变形
这就是我想用我的 NSOpenGLView 做的事情。目前 NSOpenGLView 覆盖了窗口的整个区域，我想在 NSOpenGLView 顶部添加按钮、nsviews 和图像。我浏览了网页，发现
ember.js - 如何避免使用 Ember 变形？
我正在遍历在 Controller 中定义的集合。我正在使用基础轨道插件将其转变为轮播。但是我的HTML被弄乱了，并且破坏了插件，因为它期望获得一定的输出。
java - 如何使用 BufferedImage 变形/修改图像
我不知道如何使用 BufferedImage 使图像变形。有人能帮我吗？我绝对绝望了。感谢您的所有提示。对不起我的英语不好。 | |
ios - 我如何最好地存储图像以用作核心数据存储中的 UIImage？变形？二进制数据？
这个问题的答案似乎相互矛盾，我很困惑在 Core Data 数据库中存储图像的最佳方式是什么。 This question说可变形，但是this question说要使用二进制数据。如果我只是想把它
java - 如何解决这个问题，变形 HTML 表单
您好，我不确定如何处理有关表单的逻辑。所以，表格很大，我知道有 20 多个字段被认为是“不好的做法”，表格应该最少，但这就是客户想要的，所以不用争论，无论如何表格都会接受订单，但有不同的顺序类型(更具
macos - NSWindow 调整大小后 NSView 变形
我正在使用 animator() 在我的应用程序的帧( subview )之间横向滚动 NSScrollView。当动画发生并且我调整 NSWindow 的大小时，整个 NSView 会像这样扭曲:
swift - 变形 Sprite 直到纹理不再连续 - 如何保持接触检测？
仍在我的太空入侵者克隆上工作，我想在屏幕底部添加可破坏的基地: 我已经弄清楚如何通过让炸弹和盾牌相互接触来修改盾牌的外观，然后在 didBegincontact 中，从炸弹爆炸的 mask 和盾牌的当

首页

博学

6Ren·AI

商城

python - 变形金刚 : Asking to pad but the tokenizer does not have a padding token