T/JSIA 0003-2024
基于多智能体强化学习的博弈决策系统标准

Specification for Decision-Making System Based on Multi-Agent Reinforcement Learning


 

 

非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 T/JSIA 0003-2024 前三页,或者稍后再访问。

您也可以尝试购买此标准,
点击右侧 “立即购买” 按钮开始采购(由第三方提供)。

 

标准号
T/JSIA 0003-2024
发布
2024年
发布单位
中国团体标准
当前最新
T/JSIA 0003-2024
 
 
适用范围
4 一般要求 4.1 系统组成 系统由数据存储模块、信息配置模块、交互展示模块、策略生成模块组成。 4.1.1 数据存储模块 使用数据库系统或文件系统实现感知数据和算法模型的持久化存储。 4.1.1.1 数据存储模块基本技术要求 a) 使用数据库系统或文件系统实现数据的持久化存储; b) 选择合适的数据结构和存储方式,以支持高效的数据查询和检索。 4.1.1.2 数据存储模块功能要求 a) 提供数据写入和读取接口,允许决策系统将关键数据存储到数据库或文件中,以及从中检索数据,存储系统的中心存储可支持存储容量的动态的、持续的扩充; b) 支持数据的批量存储和查询,以便于训练和分析大规模数据,且具备冗余备份的功能。 4.1.1.3 数据存储模块性能要求 a) 并发存储性能:数据存储应能够满足并发写入的要求; b) 系统不应该因为存储系统响应不及时而导致程序异常现象,数据库查询的效率应足够高,能够在短时间内返回查询结果; c) 存储设备宜对缓存进行优化设计,采用记录性能优先策略,保证对数据实时记录。 支持数据的持久化存储,以确保数据不会在系统关闭后丢失。 4.1.2 信息配置模块 对于强化学习算法应用的场景信息能够自定义配置:如智能体数量、环境基本配置信息等。实现用户界面技术,如图形用户界面(GUI)或命令行界面(CLI),使用用户界面库或框架,以便创建友好的配置界面。 4.1.2.1 信息配置模块基本技术要求 a) 设计界面,允许用户配置决策系统的参数、算法、模型等信息,系统的信息配置功能可支持环境基本属性信息的动态设置; b) 系统内部模块间高内聚、低耦合等特点,系统数据内容安全性高,且更加稳定。 4.1.2.2 信息配置模块功能要求 用户与系统进行交互配置系统环境信息,初始化对战环境,为强化学习算法提供多样的、可靠的运行环境,用户界面的响应时间应迅速,用户在界面上操作时不应感到明显的延迟。   4.1.2.3 信息配置模块性能要求 规模扩展性能:硬件环境能够支持交互环境规模的动态扩展,系统不应该因为环境复杂而导致可视化界面卡顿等异常情况。 4.1.3 交互展示模块 环境可视化:显示当前的环境状态,可能是一个图像、地图或其他可视化界面,以便用户可以观察系统的状态。这可以帮助用户了解环境的情况,监控决策系统的执行。 策略展示:在环境可视化中展示各方(代理、智能体等)当前执行的策略,以便用户可以实时观察它们的决策行为。这可以通过箭头、运动轨迹等方式实现。 实时数据更新:交互展示模块需要能够获取实时数据,包括环境的状态、各个智能体的动作、得分等。这些数据将用于更新环境可视化和策略展示。 统计信息展示:展示环境中各个指标的统计信息,如得分、胜率、执行次数等。这可以帮助用户更好地了解系统的性能。 交互性界面:提供用户与展示模块进行交互的方式,例如按钮、滑块等。用户可以通过交互来改变环境参数、调整展示方式等。 数据记录与回放:将展示的数据记录下来,以便用户可以随时回放和分析之前的决策过程。这对于改进策略、分析失败案例等非常有帮助。 可配置性:允许用户根据需要自定义展示模块的布局、显示内容和样式,以适应不同的应用场景。 错误处理与提示:提供适当的错误处理机制和提示信息,以便在出现问题时能够及时通知用户。 多模式支持:支持不同的展示模式,如实时模式、回放模式、对比模式等,以满足不同用户的需求。 可扩展性:考虑到未来可能的需求变化,展示模块应该易于扩展和升级。

T/JSIA 0003-2024相似标准


推荐

年仅38岁!国防科技大学博士生导师冯旸赫逝世

研究方向 · 主要从事强化学习智能博弈智能规划、兵棋推演技术、贝叶斯理论研究,在指挥控制、智能辅助决策方面取得重要创新突破。 · 瞄准复杂对抗环境下智能智能决策问题,提出构建兵棋推演环境中辅助决策“最强大脑”——“战颅”。...

要做自主决策AI,英国创业公司Prowler.io又融了1000万欧元

它将使用概率模型来概括新场景,并且使用数据来驱动策略修改,以适应环境变化;用强化学习来处理不确定因素;用博弈论来在智能场景(multi-agent setting)中估测人类与人工智能意图行为。   目前 Prowler.io 还在优化他们平台架构,最终平台架构会包含学习引擎和决策引擎两个部分。...

中科院自动化所将举办首届智能决策论坛

届时,欧洲科学院外籍院士、北京大学前沿计算研究中心主任邓小铁,伦敦大学学院计算机系教授汪军等多位国内外智能决策领域有影响力学者,将围绕“人工智能博弈相互作用”“主体学习”等主旨各自展开长约50分钟演讲,报告内容涵盖强化学习智能系统博弈论等研究领域。...

科技部拟33项人工智能重大项目公示 仅截至22日,速看!

42018AAA0102600基于异构融合计算模型与架构心脑血管诊疗人机协同介入技术智能平台首都医科大学附属北京天坛医院42018AAA0102700地外探测无人系统自主智能精准感知与操控北京控制工程研究所32018AAA0102800无人系统自主智能精准感知与操控清华大学32018AAA0102900自主智能灵巧精准操作学习与典型场景验证清华大学52018AAA0103000自主智能灵巧精准操作学习方法研究与验证中国科学院自动化研究所...





Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号