python - 使用openaigym(blackjack)制作ai-6ren

python - 使用openaigym(blackjack)制作ai

转载作者：太空宇宙更新时间：2023-11-03 21:22:07

25

4

我正在使用 openaigym 来制作二十一点的 AI。

但我不擅长 python 和gym，所以不知道如何完成代码。

我一直在尝试编写一个简单的代码来使用 Q-learning 构建人工智能。

但我对 open aigym 和 python 还不够熟悉。

我不知道如何检查状态的大小(env.observation_space.n 不起作用..只有 env.action_space.n 显示它的“2”)我的代码有点像健身游戏其他示例的副本(frozenlake)

帮助我完成这个简单的代码，以便我可以像 DQN 一样自己改进它。

import gym
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np

env=gym.make('Blackjack-v0')

Q=np.zeros([400,env.action_space.n])

num_episodes=10000
dis=0.99
rList=[]

for i in range(num_episodes):
    state = env.reset()
    rALL = 0
    done = False

    while not done: 
        action=np.argmax(Q[state,:]+np.random.randn(1
        ,env.action_space.n)/(i+1))


        new_state,reward,done,_=env.step(action)

        Q[state, action] = reward + dis * np.max(Q[new_state, :])
        print(rList)
        rALL += reward
        state = new_state

    rList.append(rALL)\


print(Q)

我想看到奖励列表(rList)不断上升(如果我的算法有效)

也想知道如何很好地使用gym模块。

最佳答案

当我准确了解您想要什么时，我会更新此回复

对于评论中的第一个问题，您可以使用 env.observation_space.n 获取操作数量，并通过 env.unwrapped.get_action_meanings() 获取操作的含义，如果您使用最新版本的gym。
对于第三个问题，您可以使用 env.render() 可视化游戏。

这是一个最小的工作示例，它使用 python3 和最新版本的gym版本“0.10.9”渲染游戏(您可以通过gym.__version__获取您的gym版本):

import time
import gym

# Create a breakout environment
env = gym.make('SpaceInvaders-v4')

# Reset it, returns the starting frame
frame = env.reset()

# Render
env.render()

is_done = False

while not is_done:
    # Perform a random action, returns the new frame, reward and whether the game is over
    frame, reward, is_done, _ = env.step(env.action_space.sample())
    # Render
    env.render()

    time.sleep(0.01)
    if is_done:
        env.close()
        break

关于python - 使用openaigym(blackjack)制作ai，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54160590/

25

4

0

文章推荐： c# - 图表 - 放大以显示更精确的数据

文章推荐： python - 我在 sklearn 中没有顺利得到多项式回归

文章推荐： python - OpenCV FAST - 功能太多

wit.ai - 将数据导入wit.ai
更新:下面提到的stackoverflow给出了另一种解决方案，即导入json并用正确格式的数据替换文本。我现在试图看看如何适应给定的格式，它看起来像这样: { "text" : "use
artificial-intelligence - luis.ai 与 api.ai 与 wit.ai 之间的比较？
有谁知道三者之间的具体区别和功能，或者作为开发人员是否有更多功能/更灵活地使用？最佳答案 wit.ai 与 Dialogflow 与 luis.ai ╔═══════════════════════
wit.ai - 有没有办法自动训练 Wit.ai？
我知道 Wit.ai 引擎可以通过手动验证案例来训练，但是有没有办法用一组定义的输入和输出来训练它？最佳答案您可能可以查看其中一个应用程序的导出格式并对其进行调整以导入新应用程序。 https:/
wit.ai - wit.ai 的商业用途
来自 wit.ai 团队的一些人请回答这个我们计划将 wit.ai 用于商业目的。有使用政策吗？请提供一些注意事项指南。此外，这项服务将来是否也是免费的，还是您计划推出企业版？主要是 API 命中
api-ai - 在对话框流中添加确认实体(api.ai)
我需要添加一个确认实体，以便在对话框流 (api.ai) 中的某个操作的参数中得到"is"或“取消”。假设用户正在购买咖啡，我会询问有关咖啡和数量的详细信息，最后我需要确认，我应该向哪个实体申请？任何
python - 考虑一个整数数组 n A=[a1,a2,a3......an]。查找并打印满足 ai*aj <= max(ai,ai+1,.....aj) 的总对数，其中 i < j
谁能帮我解决上面的问题。我们必须在数组 (a1,a2),(a1,a3),(a1,a4).... 等中找到元素的组合，然后选择满足条件 (ai*aj) <= max 的组合(A) 其中 A 是数组并返回
wit.ai - 我是否正确地训练了我的 wit.ai 机器人？
我正在尝试训练我的 Wit.ai 机器人以识别某人的名字。我不太确定我是否完全理解 NLP 的工作原理，所以我会给你一个例子。我定义了很多表达，比如“我的名字是XXXX”、“大家都叫我XXXX” 在
algorithm - 是否存在用于测试棋盘游戏 AI 与其他 AI 的通用站点？
我想知道是否存在一个网站，人们可以上传他们的 AI 在不同的棋盘游戏中相互竞争:国际象棋、五子棋等。该站点将接受程序的源代码(以某种通用语言编写)、对其进行编译并相互运行程序。所有程序都必须使用一些
Golang AI 开发：通过将 AI 集成到你的应用程序
大家好，我是程序员幽鬼。你想为后代开发一个令人难以置信的应用程序，你想到的第一件事——人工智能!还有什么比模仿人类智能的机器更令人着迷的呢?如果你期待打破刻板印象并准备推出出色的 AI 应用
azure - 将 AI Analytics 查询添加到 AI 仪表板？
我在 Application Insights Analytics 中创建了几个查询来获取我想要的图表。示例: customEvents | where timestamp >= ago(31d)
wit.ai - 使用 wit.ai API 删除实体值
我似乎无法让这个请求生效: https://wit.ai/docs/http/20160526#delete--entities-:entity-id-values-link 我已经设置了一个值为“C
wit.ai - wit.ai 的 Node.js 客户端调用多个自定义操作
我正在尝试在 wit.ai 中编写示例应用程序。我使用在 https://wit.ai/docs/quickstart 中显示的 node.js 客户端跟随快速启动应用程序。 .那里显示的示例只有一个
php - 如何在dialoglow(api.ai)中生成我的代理的api.ai url并在PHP中使用该api URL将用户的输入存储在MYSQL数据库中
在 api.i(dialogflow) 中，我想获取用户的输入，如姓名、年龄、邮件等，并使用 PHP 将它们存储在我的 MYSQL 数据库中。如何在对话流中生成我的代理的公共(public) API
wit.ai - 使用跨域 HTTP API 检索 Wit.ai 机器人文本响应
我目前正在与 Wit.ai 合作 webpage in CodePen.io .我想知道是否可以使用 HTTP API 检索 Wit.ai 机器人的文本响应(“Bot says”)。例如:如果用户要
java - 使用 Minimax 算法的 NIM 游戏和 AI 玩家 - AI 会输棋
我接到了一项任务，要编写一个由人类玩家和 AI 玩家组成的 NIM 游戏。游戏是“Misere”(最后一个必须拿起一根棍子的人输了)。 AI 应该使用 Minimax 算法，但它正在采取使其输得更快的
google-ai-platform - 如何取消部署模型，或者特别是如何从 Vertex AI 上的 shell 获取已部署模型的 ID？
为了通过 shell 从端点取消部署模型，我必须指定 deployed-model-id如 gcloud ai endpoints undeploy-model 中所述我如何获得这个已部署的模型 I
docker - 如何将环境变量传递给 gcloud beta ai custom-jobs create with custom container (Vertex AI)
我在谷歌的 Vertex AI 中运行自定义训练作业。执行自定义作业的简单 gcloud 命令将使用类似于以下语法的内容(可以查看命令的完整文档 here ): gcloud beta ai cust
wit.ai - 有没有办法通过 HTTP API 管理(创建/编辑/验证)Wit AI Stories？
Wit AI project 在他们的 Converse 功能中添加了一个名为 Story 的新概念。有没有办法通过 HTTP API 管理(创建/编辑/验证)这些 Wit AI 故事？最佳答案 W
dialogflow-es - 我可以在不使用 Google 的 AI 平台 (Api.ai) 的情况下将应用程序部署到 Google Assistant
我想为 Google 智能助理部署一个应用。但是，我想使用不同的 AI 后端而不是 api.ai。有人知道这是否可能吗？如何？或者如果我想使用 Google 智能助理，我会被 api.ai 困住吗
gcp-ai-platform-notebook - 如何在 GCP AI Platform Notebook 上运行 Python 3.6
我的项目有一个依赖项，需要 python v3.6+。因此，它会在通过 pip 在 python 3 内核中安装时抛出错误，因为 AI Platform Notebooks 默认附带 v3.5。如何使

首页

博学

6Ren·AI

商城

python - 使用openaigym(blackjack)制作ai