python - 我如何改进我的模型，使其能够处理数据集中没有的更多字符？-6ren

python - 我如何改进我的模型，使其能够处理数据集中没有的更多字符？

转载作者：行者123 更新时间：2023-12-01 07:58:06

在我的上一篇文章中链接 here ，据说我必须修改我的模型才能变得更好。引用唯一回答者对我的问题的评论(再次感谢您，先生):

The accuracy of prediction is a metric of how good your neural network architecture is and it also depends on your train/validation data. You will have to tune your neural network in such a way that you generalize well by adjusting the hyper parameters such as number of layers, type of layers, learning rate, optimizer etc. ...

我想知道我会如何做这些提到的事情。或者至少，指向正确的方向。老实说，我在理论和实践中都迷失了。

我唯一能做的就是将纪元调整到100以上。我还尽可能地清理了要识别的图像。

目前，这是我创建模型的方式。它仅基于Tensorflow 2.0的教程。

import numpy as np
import tensorflow as tf
from tensorflow import keras

# Load and prepare the MNIST dataset. Convert the samples from integers to floating-point numbers:
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

def createModel():  
  # Build the tf.keras.Sequential model by stacking layers. 
  # Choose an optimizer and loss function used for training:
  model = tf.keras.models.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dropout(0.2),
    keras.layers.Dense(10, activation='softmax')
  ])

  model.compile(optimizer='adam',
                loss='sparse_categorical_crossentropy',
                metrics=['accuracy'])

  return model

model = createModel()
model.fit(x_train, y_train, epochs=102, validation_data=(x_test, y_test))
model.evaluate(x_test, y_test)

它为我提供了大约 0.9800 的验证准确度。但它对我从文档中提取的手写字符图像的表现却很糟糕。我还希望对其进行扩展，以便它还可以读取其他选定的字符，但我想这可能是另一天的另一个问题。

谢谢!

最佳答案

您可以在开始时使用多层卷积/最大池，通过扫描图像来执行特征提取。之后，您可以像以前一样使用完全连接的神经网络和 softmax。

您可以这样创建一个带有 CNN 的模型:

from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout 
from keras.models import Sequential 

# Create the model
model = Sequential()

# Add the 1st Convolution/ max pool
model.add(Conv2D(40, kernel_size=5, padding="same",input_shape=(28, 28, 1), activation = 'relu')) 
model.add(MaxPooling2D(pool_size=(2, 2), strides=(2, 2))) 

# 2nd convolution / max pool
model.add(Conv2D(200, kernel_size=3, padding="same", activation = 'relu')) 
model.add(MaxPooling2D(pool_size=(3, 3), strides=(1, 1)))

# 3rd convolution/ max pool
model.add(Conv2D(512, kernel_size=3, padding="valid", activation = 'relu')) 
model.add(MaxPooling2D(pool_size=(3, 3), strides=(1, 1)))

# Reduce dimensions from 2d to 1d
model.add(Flatten()) 
model.add(Dense(units=100, activation='relu'))

# Add dropout to prevent overfitting
model.add(Dropout(0.5))

# Final fullyconnected layer
model.add(Dense(10, activation="softmax")) 
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) 

print(model.summary())

返回以下模型:

Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_1 (Conv2D)            (None, 28, 28, 40)        1040      
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 14, 14, 40)        0         
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 14, 14, 200)       72200     
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 12, 12, 200)       0         
_________________________________________________________________
conv2d_3 (Conv2D)            (None, 10, 10, 512)       922112    
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 8, 8, 512)         0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 32768)             0         
_________________________________________________________________
dense_1 (Dense)              (None, 100)               3276900   
_________________________________________________________________
dropout_1 (Dropout)          (None, 100)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 10)                1010      
=================================================================
Total params: 4,273,262
Trainable params: 4,273,262
Non-trainable params: 0
_________________________________________________________________

关于python - 我如何改进我的模型，使其能够处理数据集中没有的更多字符？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55849555/

文章推荐： php查询。如何解析表标记中的每第九个

文章推荐： jquery - 如何使用按钮更改谷歌地图的大小

文章推荐： c# - 使用 Json 将具有两个对象的 View 模型传递给 Controller

文章推荐： java - 无法从数据库中获取元素两次

java - 能够 "tick"的时钟
我正在使用 Java 编写一个时钟程序，该程序能够“滴答作响”，但它存在问题。我认为它与 getter 和 setter 或 toString() 方法有关。计数器类 package clock;
javascript - React onwheel 不执行现有的scrollintoview 但 onclick 能够
const Index = () => { // Ref Links const frefLinks = { 1: useRef(1), 2: useRef(2), 3: useRef(3
python - 为什么 multiprocessing.Process 能够 pickle 修饰函数？
所以我读了here不能 pickle 装饰函数。确实: import multiprocessing as mp def deco(f): def wrapper(*args, **kwarg
go install 不创建包的二进制文件，而 go get 能够
我在go1.11.2 linux/amd64 版本。当包godog使用 go get github.com/DATA-DOG/godog/ 安装，godog 可执行文件在 $GOPATH/bin/中创
php - 在 Android 中编码字符串以便 PHP 能够 gzdecompress 它？
如何正确压缩字符串，以便 PHP 能够解压缩？我试过这个: public static byte[] compress(String string) throws IOException {
Z3 无法通过测试证明两个使用 Kleene 代数的简单程序之间的等价性，但 Mathematica 和 Reduce 能够
我们这里的问题是表明在测试中使用 Kleene 代数。在 b 的值由 p 保留的情况下，我们有交换条件 bp = pb;两个程序之间的等价性简化为等式在 b 的值不被 p 保留的情况下，我们有交
linux - openstack Quantum VM 能够 ping br-ex 但不能 ping 外部网络
我有一个与我的网络相关的非常奇怪的问题，我在具有多个接口(interface)的 VirtualBox 上安装了 RDO Grizzly OpenStack。虚拟盒子: eth0 - managem
javascript - Node.js 上的 TokenError : Bad Request; Google OAuth2; Passport. js；能够 console.log 数据，但是会出现错误
我正在尝试使用 Passport.js授权谷歌OAuth2在 Node.js .我整个星期都在尝试让它工作，但不知道为什么它不工作，所以现在我求助于 stack 寻求一些潜在的帮助。我已经尝试了所有在

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 我如何改进我的模型，使其能够处理数据集中没有的更多字符？