- 一个有情怀的自媒体账号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~二维码自定义二维码网站自定义网站或网址
刺激,无人机竞速超越顶级人类玩家,强化学习再登Nature封面
最近,在一场无人机比赛中,一架自主控制的无人机战胜了顶级人类玩家。大语言模型(LLM)预训练数据集调研分析
本文旨在总结一些开源的英文大模型的 pre-training dataset.8个ChatGPT玩狼人杀,带节奏,装无辜,打掩护,一样不落
除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。OpenAI:LLM能感知自己在被测试,为了通过会隐藏信息欺骗人类|附应对措施
研究人员提出了一种方法来识别和预判情景感知能力的出现的和可能性。DISC-MedLLM:复旦大学团队发布中文医疗健康个人助手,开源47万微调数据
复旦大学数据智能与社会计算实验室(FudanDISC)发布中文医疗健康个人助手——DISC-MedLLM。使用LLM构建AI Agents的正确姿势!ChatGPT作者博客全面总结
以LLM(大语言模型)作为核心控制器构建智能体是一个很酷的概念。AutoGPT、GPT-Engineer和BabyAGI等几个概念验证演示都是鼓舞人心的示例。如何用 LangChain 实现一个Zero Shot智能决策器(附源码)
今天给大家带来一篇何枝大佬(知乎@何枝)的文章《如何用LangChain实现一个Zero Shot智能决策器》,并附上源码。吴恩达最新博文:机器学习领域六个核心算法的溯源和总结
最近,吴恩达在其创办的人工智能周讯《The Batch》上更新了一篇博文,总结了机器学习领域多个基础算法的历史溯源。选择你的道路:LLM 时代指南
上半年还能看到不少文章谈类似感受,都给了在 LLM 时代研究的建议。那么现在都到下半年了,真实情况又如何呢。有人把NLP领域分类、发展趋势可视化了!德国慕尼黑工业大学构建NLP 360度全景图
今天介绍的这篇论文,对最近 20 年 NLP 研究领域进行了一个详尽系统的分类与综述,帮助大家站在一个上帝视角,概览 NLP 360 度的全景图。谷歌:大模型不仅有涌现能力,训练时间长了还有「领悟」能力
模型在达到一定规模时会出现涌现现象,谷歌的研究表明,模型在训练到一定时间后,会出现另一种现象,即「领悟」现象。全都结束了?LK-99只是铁磁材料,不是超导体,北大等更多研究论文公布
「不幸的是,一切都结束了。」大模型=缸中之脑?通院朱松纯团队剖析AGI关键缺失
“知行合一”:大语言模型距离通用人工智能最欠缺的一步多模态大模型的幻觉问题与评估
本文探讨并评估了目前多模态大模型的幻觉问题。ACL 2023 |信息减加法:基于特征去噪和主题增强的多模态关系抽取
我们提出了一种新颖的方法,同时实现了内部信息细筛选和外部信息强化利用,从而在MRE人物上取得广泛的性能提升。110K零电阻但无完全抗磁性:东南大学LK-99超导新进展,已有论文
在制备的LK-99材料上,东南大学研究者观测到了110K温度以下,常压0电阻。但在迈斯纳效应测量中又未观测到完全抗磁性。「研究问题」写不明白,读者一脸懵!MIT博士手把手教你写「问题设定」:论文得能变代码才行
看研究问题能不能转成代码,一个小测试轻松解决!斯坦福博士一己之力让Attention提速9倍!FlashAttention燃爆显存
继超快且省内存的注意力算法FlashAttention爆火后,升级版的2代来了。探究检索增强下的大模型知识边界
我们小组的最新工作,初步分析了LLM在开放域问答任务上的性能、感知其知识边界的能力,并研究了引入检索增强后如何影响上述能力。LLM 全景图 (The Landscape of LLM)
希望可以俯瞰当前 LLM 领域,能够给个整体的印象,如若对某个细分板块感兴趣,读者也可以找更深入的资料。