- 让创新获得认可二维码自定义二维码网站自定义网站或网址
NeurIPS 2022 | 频域中卷积神经网络对抗鲁棒性的探究与提升
在该工作中,我们基于Shapley值量化了一张图像中不同频率成分对CNN输出的影响,并探究了对抗训练与对抗攻击对CNN的影响;NeurIPS 2022 | 分布外可泛化的分子表示学习框架
我们提出了一个名为 MoleOOD 的新分子表示学习框架,以增强分子表示学习模型对这种分布变化的鲁棒性。AAAI 2023|模拟人脑场景感知过程,套娃Transformer讲故事能力更上一层楼
视频字幕生成目前已成为工业界AI创作领域非常火热的研究话题,这一技术可以应用在短视频的内容解析和讲解中,AI讲故事的技术已经越来越成熟。COLING 2022 | 融合自适应机制与自训练框架的无监督文本顺滑方法
本文提出了一种基于Re-weighting 机制的自适应自训练框架,根据每个样本的置信分配权重来解决上述存在的两个问题。3D视觉技术登上火星?NASA也用上了NeRF技术做太空勘探
本文研究的重点就是如何使用来自火星车上的相机数据生成火星表面的3D场景,以帮助研究火星地质,进行模拟导航和火星形状分析。NeurIPS 2022 | 序列(推荐)模型的分布外泛化:因果视角下的分析与求解
本文主要探索的问题是:如何训练一个可靠的序列模型,它可以有效泛化到未知分布的测试数据上?CVPR 2022 | 达摩院高清人像美肤模型ABPN
我们以实现专业级的智能美肤为出发点,研发了一套高清图像的超精细局部修图算法ABPN,在超清图像中的美肤与服饰去皱任务中都实现了很好的效果与应用。NeurIPS 2022 | NAS-Bench-Graph:图神经网络架构搜索Benchmark
本文旨在简要介绍一个图神经网络架构搜索(GNAS)的节点分类 Benchmark,同时也是 GNAS 的第一个 Benckmark。NeurIPS 2022 | PRNet:基于策略梯度的布局与生成式布线网络求解芯片布局布线
我们于该工作中提出了名为 PRNet 的模型以解决上述问题,其中布局端通过基于策略梯度的强化学习方法来实现,同时考虑元件的实际大小;In-Context Learning玩法大全
比起小模型,大模型有一个很重要的涌现能力就是ICL,也是一种新的范式,指在不进行参数更新的情况下,只在输入中加入几个示例就能让模型进行学习NeurIPS 2022 | PointTAD:基于稀疏点表示的多类别时序动作检测框架
时序动作检测工作 PointTAD,基于一组稀疏时序点来形成更加精细的动作时序表征,解决多类别时序动作检测中并发动作定位和复杂动作建模两大难题。NeurIPS 2022 | 仅用256KB就实现单片机上的神经网络训练
我们仅用了不到 256KB 内存就实现了设备上的训练,开销不到 PyTorch 的 1/1000,同时在视觉唤醒词任务上(VWW)达到了云端训练的准确率。NeurIPS 2022 | 人脸复原新利器:CodeFormer
南洋理工大学-商汤科技联合研究中心S-Lab提出了一种基于VQGAN+Transformer的人脸复原模型CodeFormer。CVPR 2022 Oral | LAS-AT:一种基于可学习攻击策略的对抗训练新范式
框架由一个使用对抗样本进行训练以提高鲁棒性的目标网络和一个产生攻击策略以控制对抗样本生成的策略网络组成。在不同数据集上的实验结果展现了LAS-AT的优越性。NeurIPS 2022 | 赋予AI语言理解和场景感知的能力,实现目标导向的室内人体运动生成
这项研究工作赋予了AI语言理解和场景感知的能力,实现了目标导向的室内人体运动生成。NeurIPS 2022 | 结合轨迹预测与控制信号的端到端自动驾驶模型
本文我们将介绍一我们于该工作中提出了一种名为 TCP 的模端到端自动驾驶模型,目标即是将轨迹规划和控制预测结合到一个统一的框架中,从而取长补短,获得优异的性能。当艺术遇上AI:AI赋能生产力的可能场景和应用思路
本文记录五位学术、影视、建筑、科技、AI等领域重磅嘉宾在“科普大佬说”活动上的精彩分享。他们就“AI赋能生产力的可能场景和应用思路”进行了分享并展开讨论。通俗形象地分析比较生成模型(GAN/VAE/Flow/Diffusion/AR)
这篇文章不对各个模型做详细介绍,而是通过形象的比喻来解释比较各个生成模型。美团外卖搜索基于Elasticsearch的优化实践
本文从问题分析、技术选型、优化方案等方面进行阐述,并给出最终灰度验证的结论。探索图像逆问题的本质:零值域分解
这是一个全新的解决low-level问题的思路,我们无需训练,就能达到接近sota的重建效果(认为如果有一个预训练的高分辨率扩散模型,效果会更好)。