- AI行业最新动态,机器学习干货文章,深度学习原创博客,深度学习实战项目,Tensorflow中文原创教程,国外最新论文翻译。欢迎喜欢AI、关注深度学习的小伙伴加入我们。二维码自定义二维码网站自定义网站或网址
一次性分割一切,比SAM更强,华人团队的通用分割模型SEEM来了
CV 领域已经卷到了一个新的高度。彻底解决ChatGPT健忘症!突破Transformer输入限制:实测支持200万个有效token
用RMT模型提升Transformer类模型的脑容量,内存需求不变,输入序列可以无限长。南科大黑科技:一键消除视频人物,特效师的救星来了!
来自南方科技大学的这款视频分割模型,可以追踪视频中的任意事物。DeepFloyd Lab 联合 StabilityAI 开源的大模型 DeepFloyd IF
本文将介绍 DeepFloyd IF ,这是一个最先进的开源文本生成图像模型(Text-to-Image),具有高度的逼真度和语言理解能力。大模型物种进化图转疯了:8位华人打造,一眼看懂“界门纲目”,原来BERT后代已绝种
这几天,一张名为“大语言模型进化树”的动图在学术圈疯转HugNLP发布,集成多种NLP任务,可训ChatGPT类模型
近日,华师大HugAILab团队研发了HugNLP框架,这是一个面向研究者和开发者的全面统一的NLP训练框架最大规模评测!通用AI大模型Segment Anything在医学影像分割的性能究竟如何?
Meta AI 发布第一个用于图像分割的大规模基础模型Segment Anything Model (SAM)。编程能力超强、还支持 100 多种语言,谷歌将在开发者大会上发布“巨型巴德”PaLM 2
谷歌正在为开发人员提供其最先进的人工智能语言模型之一:PaLM。图文理解能力强大!多模态对话生成模型:mPLUG-Owl,已开源!
今天要介绍的模型是一款类似于miniGPT-4和LLaVA的多模态对话生成模型,它的名字叫mPLUG-Owl。Stable Diffusion又出大招!「文生动画」震撼发布淘汰导演,DC英雄一秒变身
Stability AI又来卷了AI视觉圈了!Stable Animation震撼发布,动画效果令人惊叹。蒸馏也能Step-by-Step:新方法让小模型也能媲美2000倍体量大模型
华盛顿大学联合谷歌云计算人工智能研究院、谷歌研究院针对该问题进行了进一步解决,提出了逐步蒸馏范式帮助模型训练。终结扩散模型:OpenAI开源新模型代码,一步成图,1秒18张
扩散模型的时代结束了。小扎亲自官宣Meta视觉大模型!自监督学习无需微调,多任务效果超OpenCLIP丨开源
无需文字标签,完全自监督的Meta视觉大模型来了!从Blip2到Segment Anything视觉语义金字塔+ChatGPT= 把图片变文本段落
我们惊讶发现, 把Bounding Box 和 Object信息给到GPT4, GPT4很自然的能推理出物体之间的位置关系,甚至想像出物体之间的联系。ChatGPT 逆向生成 Prompt,用魔法生成魔法!
网络上分享 Prompt 的已经有很多了,今天给大家分享一下,如何通过 ChatGPT 逆向来生成并优化 Prompt。OpenAI API 进阶使用指南01
什么构建一个自己知识库的问答机器、让你的 OpenAI API 联网搜索并给出回答、总结 PDF 文档、基于某个 Youtube 视频进行问答 。MiniGPT-4: 使用先进的大型语言模型增强视觉语言理解
我们现在提供了一个与 Vicuna-7B 对齐的预训练MiniGPT-4!演示GPU内存消耗现在可以低至12GB。3D模型分割新方法解放双手!不用人工标注,只需一次训练,未标注类别也能识别|港大&字节
3D模型分割现在也解放双手了!首个超大规模GAN模型!生成速度比Diffusion快20+倍,0.13秒出图,最高支持1600万像素
GAN模型也有变大的潜力!可以微调类ChatGPT模型啦!开源Alpaca-LoRA+RTX 4090就能搞定
Alpaca-LoRA 将微调类 ChatGPT 模型的算力需求降到了消费级,训练个自己的中文对话模型真就没那么难了。