机器学习算法与自然语言处理的文章列表

机器学习算法与自然语言处理

一个有情怀的自媒体账号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~
二维码

自定义二维码
网站

自定义网站或网址

如何高效部署大模型？CMU最新万字综述纵览LLM推理MLSys优化技术

该综述不仅是对当前 LLM 服务优化研究的全面概述，也为未来在这一领域的探索和发展指明了方向。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 255
vLLM皇冠上的明珠：深入浅出理解PagedAttention CUDA实现

当前，在大模型推理框架领域，vLLM 以其卓越的高吞吐性能和简洁易读的代码而备受瞩目，已经成为许多团队二次开发的首选。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 2052
深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

现在，复旦团队进一步挖掘 RLHF 的潜力，重点关注奖励模型（Reward Model）在面对实际应用挑战时的表现和优化途径。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 296
微软最新研究成果：使用GPT-4合成数据来训练AI模型，实现SOTA！

最近，微软发布了一种新颖的文本嵌入方法，使用专有的LLMs为93种语言中各种文本嵌入任务生成合成数据，并且涉及了多个任务场景。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 238
搜索引擎对AIGC更加偏爱！AIGC会淹没UGC吗?

「AIGC的繁荣会淹没UGC吗？」
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 275
专补大模型短板的RAG有哪些新进展？这篇综述讲明白了

这份工作为研究人员绘制了一幅清晰的 RAG 技术发展蓝图，指出了未来的研究探索方向。
- 赞同 0
- 反对 0
- 专注 1
- 评论 0
- 浏览 703
语言模型是如何感知时间的？「时间向量」了解一下

时间变化在一定程度上被编码在微调模型的权重空间中，并且权重插值可以帮助自定义语言模型以适应新的时间段。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 319
AI解读视频张口就来？这种「幻觉」难题Vista-LLaMA给解决了

Vista-LLaMA 在处理长视频内容方面的显著优势，为视频分析领域带来了新的解决框架。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 292
GPT-5前瞻！艾伦人工智能研究所发布最强多模态模型，预测GPT-5新能力

艾伦人工智能研究所推出的Unified-IO 2是第一个可以处理和生成文本、图像、音频、视频和动作序列的模型。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 332
多轮对话推理速度提升46%，开源方案打破LLM多轮对话的长度限制

在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 377
奋战一年，LangChain首个稳定版本终于发布，LangGraph把智能体构建为图

著名的大模型智能体工具，现在有大版本更新了。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 497
面向表格数据的大模型推理综述

我们在本文对现有的基于LLM的表格推理相关工作进行梳理，来促进该领域上的研究。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1100
东北大学NLP Lab&小牛翻译 “自然语言处理视角下的Transformer”

全文共119页，从自然语言处理的角度，全面介绍了Transformer模型的基础知识和其在自然语言处理应用中的进展
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 395
EMNLP2023｜大语言模型知识编辑问题、方法与挑战

本文初步探讨了大语言模型知识编辑相关的问题、方法和机遇。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1229
从大脑活动中解码自然语言：任务与前沿方法

语言不仅是人类交流的工具，更是思维和智能的基础。大脑如何解码和处理语言信息是揭示人类智能本质的关键。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 441
“离谱的AI扩图”火了！张张那叫一个出其不意

家人们，真的是要被抖音AI扩图给笑死了——
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 264
思维链提出者Jason Wei：关于大模型的6个直觉

大模型究竟从下一个词预测任务中学到了什么呢？
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 366
PyTorch团队重写「分割一切」模型，比原始实现快8倍

我们该如何优化 Meta 的「分割一切」模型，PyTorch 团队撰写的这篇博客由浅入深的帮你解答。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 283
全网大讨论：引爆OpenAI全员乱斗的Q*到底是什么？

强大到能威胁人类，所以不得不把自家 CEO 开了？
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 259
提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

最近，来自北大的研究人员提出了一种全新的视觉语言大模型——Video-LLaVA，为alignment before projection提供了新颖的解决方案。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 603

加载更多