python - Keras 文本分类 : Validation Accuracy doesn't change-6ren

python - Keras 文本分类 : Validation Accuracy doesn't change

转载作者：行者123 更新时间：2023-12-05 07:36:04

27

4

所以，我正在构建一个基本的 Keras 文本分类器，但无论我做什么，我都无法使验证准确率高于 49-50%(或更低)。我的训练准确率攀升非常正常，从 50% 左右开始，在 4-5 个 epoch 后攀升至 80% 左右。

这是一个输出示例:

 - 54s - loss: 0.6982 - acc: 0.5064 - val_loss: 0.6932 - val_acc: 0.4950
Epoch 2/3
 - 57s - loss: 0.6560 - acc: 0.6580 - val_loss: 0.7324 - val_acc: 0.4950
Epoch 3/3
 - 60s - loss: 0.5359 - acc: 0.7047 - val_loss: 0.7339 - val_acc: 0.4955

这是我的代码:

import logging
logging.getLogger("tensorflow").setLevel(logging.ERROR)
import numpy as np
import os
from keras.preprocessing.text import Tokenizer
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Flatten
from keras.layers.embeddings import Embedding
from keras.layers import Dropout
from keras.preprocessing import sequence
from keras.layers.convolutional import Conv1D
from keras.layers.convolutional import MaxPooling1D
from keras import optimizers
np.random.seed(7)
class TextClassifier:

    def __init__(self):
        self.tokenizer = Tokenizer(num_words = 5000)
        self.top_words = 5000
        self.max_words = 500
        self.model = model = Sequential()
        model.add(Embedding(self.top_words,64,input_length = self.max_words))
        model.add(Conv1D(filters = 64,kernel_size=3,padding='same',activation='relu'))
        model.add(MaxPooling1D(pool_size=2))
        model.add(Dropout(0.5))
        model.add(Flatten())
        model.add(Dense(250,activation='relu'))
        model.add(Dense(1,activation='sigmoid'))
        model.compile(loss='binary_crossentropy',optimizer = 'adam',metrics = ['accuracy'])

    def train(self, X_train, y_train, X_test, y_test):
        self.model.fit(X_train,y_train, shuffle = True,
        validation_data = (X_test,y_test),epochs = 3,batch_size=512,verbose = 2)

    def predict(self,X):
        return self.model.predict(X)

    def init_tokenizer(self,X):
        self.tokenizer.fit_on_texts(X)

    def eval(self,X,y):
        return self.model.evaluate(X, y, verbose=0)

    def proccess_text(self,X):
        vocab_text = self.tokenizer.texts_to_sequences(X)
        vocab_text = sequence.pad_sequences(vocab_text,maxlen=500)
        return vocab_text

    def organize_text(self,pos_path,neg_path):
        data = {'label':[],'text':[]}
        pos_texts = self.text_to_array(pos_path)
        neg_texts = self.text_to_array(neg_path)
        for i in pos_texts:
            data['label'].append(0)
            data['text'].append(i)
        for i in neg_texts:
            data['label'].append(1)
            data['text'].append(i)
        return data

    def text_to_array(self,path):
            ''' Takes a path argument and retrieves all the text lines from
                within a folder'''
            name_list = []
            texts = []
            for file_ in os.listdir(path):
                name_list.append(file_)
            for i in name_list:
                file_ = open(path+i)
                texts.append(file_.read().splitlines())
            return texts





from TextClassifier import *

path = './data/train/'
test_path = './data/test/'
model = TextClassifier()

data = model.organize_text(path+'pos/',path+'neg/')
tests = model.organize_text(test_path+'pos/',test_path+'neg/')
model.init_tokenizer(data['text'])
model.init_tokenizer(tests['text'])
X_train  = np.array(model.proccess_text(data['text']))
X_test = np.array(model.proccess_text(tests['text']))
y_train = data['label']
y_test = tests['label']
model.train(X_train,y_train,X_test,y_test)
scores = model.eval(X_test,y_test)
input_ = model.proccess_text(['It was very good! Awesome! Enjoyable!'])
print("Predict: ")
predict = model.predict(input_)
print(predict)
print("Accuracy: %.2f%%" % (scores[1]*100))

我的语料库来自这里:http://ai.stanford.edu/~amaas/data/sentiment/并且我只是将每个类的前 1000 个拆分为验证数据。 (他们是无序的 afaik)

最佳答案

我不知道 Dropout(0.5) 对您的模型有多大帮助。看起来 BatchNormalization() 可能是一个很好的替代品。您可能需要在嵌入层之后考虑一个 LSTM 层。您可以直接将 dropout 添加到 LSTM。例如:

model.add(LSTM(lstm_out, dropout_U=0.2, dropout_W=0.2))

对于一个很好的完整示例，我邀请您查看此模型: https://www.kaggle.com/ngyptr/lstm-sentiment-analysis-keras

希望这对您有所帮助，祝您好运!

编辑:根据我下面的评论

我认为您的模型可能正在训练非字符标记，因为如果您使用此 text_to_array(self,path) 函数，您的验证准确度为 .79、.85 和 .87:

    import re
def text_to_array(self,path):
            ''' Takes a path argument and retrieves all the text lines from
                within a folder'''
            name_list = []
            texts = []
            for file_ in os.listdir(path):
                name_list.append(file_)
            for i in name_list:
                file_ = open(path+i)
                for line in file_.read().splitlines():
                    # I just preprocessed your text here
                    texts.append(re.sub('[^a-zA-z0-9\s]','',line.lower()))
            return texts

如果这有帮助，请告诉我。

关于python - Keras 文本分类 : Validation Accuracy doesn't change，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49286496/

27

4

0

文章推荐： json - Microsoft Graph API 正在为 MSA 用户返回未知错误

文章推荐： user-roles - R3 Corda角色管理系统

文章推荐： dart - 将谷歌日历插入 flutter 移动应用程序

文章推荐： python Selenium : How to reuse a class from another class

c# - 无法从 Func 转换为 Func
我对这个错误很困惑: Cannot implicitly convert type 'System.Func [c:\Program Files (x86)\Reference Assemblies\
rust - 所有 T、&T、&mut T、[T]、&[T]、*mut T 的通用实现
考虑这段代码: pub trait Hello { fn hello(&self); } impl Hello for Any { fn hello(&self) {
c++ - "T t = {};"和 "T t{};"可以产生不同的结果吗？
问题很简单。是否可以构造这样一个类型 T，对于它下面的两个变量声明会产生不同的结果？ T t1 = {}; T t2{}; 我已经研究 cppreference 和标准一个多小时了，我了解以下内容:
java - Comparator中的compare(T,T)不能应用于(T,T)
Intellij idea 给我这个错误:“Compare (T, T) in Comparator cannot be applied to (T, T)” 对于以下代码: public class
php -\n\t\t\t\t\在php中的含义和用途是什么
任何人都可以告诉我 : n\t\t\t\t\n\t\t\t 在以下来自和 dwr 服务的响应中的含义和用途是什么. \r\n\t\t\t \r\n\t\t\t
c++ - "T a"、 "T a()"和 "T a=T()"之间有什么区别，其中 T 是一个类？
让 T 成为一个 C++ 类。下面三个指令在行为上有什么区别吗？ T a; T a(); T a = T(); T 为不带参数的构造函数提供了显式定义这一事实是否对问题有任何改变？后续问题:如果
Rust中的智能指针:BoxRcArcCellRefCellWeak
Rust中的智能指针是什么智能指针（smart pointers）是一类数据结构，是拥有数据所有权和额外功能的指针。是指针的进一步发展指针（pointer）是一个包含内存地
c++ - 交替排序数组的最简单方法是什么(例如 :T, T,F,F,F,T,F,T,F,F,F 到 T,F,T,F,T,F,T,F,T,T ,T)?
比如我有一个 vector vector > v={{true,1},{true,2},{false,3},{false,4},{false,5},{true,6},{false,7},{true,8
Python 3 Pandas - 带有额外\n\t\t\t\t\t 的列
我有一个来自 .xls 电子表格的数据框，我打印了 print(df.columns.values) 列，输出包含一个名为:Poll Responses\n\t\t\t\t\t。我查看了 Excel
java - 为什么Stream.reduce采用BinaryOperator 而不是BiFunction ？
This question already has answers here: What are good reasons for choosing invariance in an API like
rust - &T 和 T/&, ~T 和 T/~ 的区别
指针类型作为类型前缀与在类型前加斜杠作为后缀有什么区别。斜线到底是什么意思？最佳答案语法 T/~ 和 T/& 基本上已被弃用(我什至不确定编译器是否仍然接受它)。在向新向量方案过渡的初始阶段，[T
c++ - 如何从 T、T& 或 T* 模板参数中获取 T*
我正在尝试找到一种方法来获取模板参数的基类。考虑以下类: template class Foo { public: Foo(){}; ~Foo(){};
c++ - 当 T 声明为 T::T(T&) 时，std::is_trivially_constructible::value 的结果不正确
这是一个让我感到困惑的小问题。我不知道如何描述它，所以只看下面的代码: struct B { B() {} B(B&) { std::cout ::value #include
c++ - T::T(T&)有什么用？
为什么有 T::T(T&) 而 T::T(const T&) 更适合 copy ？ (大概是用来实现move语义的？？？) 原始描述(被melpomene证明是错误的): 在C++11中，支持了一种新
java - 类型参数 T 使用 Eclipse 在 T[] toArray(T[] a) 中隐藏类型 T
在 Java 7 中使用 eclipse 4.2 并尝试实现 List 接口(interface)的以下方法时，我收到了警告。 public T[] toArray(T[] a) { ret
foo[T](T,T) : T 的 Scala 类型扩展/推断
假设有三个函数: def foo[T](a:T, b:T): T = a def test1 = foo(1, "2") def test2 = foo(List(), ListBuffer()) 虽
generics - 通用类型统一 : multiple parameters (T, T) 与多个参数列表 (T)(T)？
我对柯里化(Currying)和非柯里化(Currying)泛型函数之间类型检查的差异有点困惑: scala> def x[T](a: T, b: T) = (a == b) x: [T](a: T,
c++ - 转发引用 : returning T when given T&& and T& when given T&
考虑一个类A，我如何编写一个具有与相同行为的模板 A& pretty(A& x) { /* make x pretty */ return x; } A pretty(A&& x) {
java - 为什么在 T 是类型参数而 t 是变量的情况下不允许使用 "t instanceof T"？
Eclipse 表示由于泛型类型橡皮擦，类型参数不允许使用 instanceof 操作。我同意在运行时不会保留任何类型信息。但是请考虑以下类的通用声明: class SomeClass{ T
c++ - T t {x} 和 T t = { x } 对于整数或枚举类型的区别？
在 C++14 中: 对于任何整数或枚举类型 T 以及对于任何表达式 expr: 有没有区别: struct S { T t { expr }; }; 和 struct S { T t = { exp

首页

博学

6Ren·AI

商城

python - Keras 文本分类 : Validation Accuracy doesn't change