Beta
首页
社区
技术
Open AI
搜索
登录 / 注册
编辑
强化学习
(这个标签还没有简介,来参与编辑吧)
文章数
17
帖子数
1
最新创建
空间音频
3DoF
6DoF交互技术
上下文长度
交叉注意力机制
Unlimi
former
网络去实体化
网络克隆技术
LVlab
Collaborat
多模态人脸生成
对齐
LIMA
CoDi
可组合扩散
逆合成
低秩自适应
LoRA
交互式超长文本生成
Recurrent
SiamFC
MDNet
SOT
目标追踪
mPLUG2
多模态基础模型
模块化思想
IDRec
MoRec
相关文章
训练提速17%,第四范式开源强化学习研究框架,支持单、多智能体训练
机器之心
· 赞同
0
IBM 入局:开源自对齐方法训练「单峰骆驼」,比GPT4更值得信赖
机器之心
· 赞同
0
Science|AI带来又一突破,或将蛋白质设计带入新时代
新智元
· 赞同
0
ICLR 2023 | PromptPG:当强化学习遇见大规模语言模型
机器之心
· 赞同
0
谷歌复用30年前经典算法,CV引入强化学习,网友:视觉RLHF要来了?
机器学习算法与自然语言处理
· 赞同
0
7 Papers | AAAI 2023杰出论文奖;AI生成文本检测方法综述
机器之心
· 赞同
0
NeurIPS 2022 | PRNet:基于策略梯度的布局与生成式布线网络求解芯片布局布线
将门
· 赞同
0
首次引入!用因果推理做部分可观测强化学习|AAAI 2023
新智元
· 赞同
0
AI好奇心,不只害死猫!MIT强化学习新算法,智能体这回「难易通吃」
新智元
· 赞同
0
NeurIPS 2022 Oral | 离线强化学习新范式!京东科技&清华提出解耦式学习算法
机器之心
· 赞同
0
相关帖子
2021, 字节跳动强化学习团队招聘ing
埼玉老师
讨论
反馈
反馈列表
快速反馈
添加中文文档