Beta
首页
社区
技术
Open AI
搜索
登录 / 注册
编辑
强化学习
(这个标签还没有简介,来参与编辑吧)
文章数
30
帖子数
1
最新创建
后退推理
SplitFuse
FastGen
自动编码器
DMV3D
AI视觉
自回归模型
Mirasol3B
W2D
散粒噪声
物理
奇怪金属
LCM
SDXLTurbo
医疗影像AI
PANDA
大型多模态模型
MMMU
分割一切
Qlearning
Qstar
视觉语言大模型
VideoLLaVA
深度网络架构
ReMax
RSO
NDSS
ICL推理
360度新视图合成
3D感知扩散模型
相关文章
NeurIPS 2023 | ContextWM:解锁世界模型的现实场景视频预训练
将门
· 赞同
0
RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶
机器之心
· 赞同
0
NeurIPS 2023 | 动态组合模型来应对数据分布的变化
将门
· 赞同
0
狂揽4k star,AI通过强化学习玩宝可梦,两万场后成功拿下
机器之心
· 赞同
0
独家|OpenAI超级对齐负责人Jan Leike:如何破解对齐难题?用可扩展监督
机器学习算法与自然语言处理
· 赞同
0
刺激,无人机竞速超越顶级人类玩家,强化学习再登Nature封面
机器学习算法与自然语言处理
· 赞同
0
大模型RLHF算法更新换代,DeepMind提出自训练离线强化学习框架ReST
将门
· 赞同
0
Transformer+强化学习,谷歌DeepMind让大模型成为机器人感知世界的大脑
机器之心
· 赞同
0
ICCV 2023 Oral | UniDexGrasp++:基于几何感知课程和迭代通用-专家策略学习的灵巧手抓取算法
将门
· 赞同
0
语言模型做先验,统一强化学习智能体,DeepMind选择走这条通用AI之路
机器之心
· 赞同
0
相关帖子
2021, 字节跳动强化学习团队招聘ing
埼玉老师
讨论
反馈
反馈列表
快速反馈
添加中文文档