:像人一样学习推理的图片模型(eta公司发布)腾讯云开发者社区

近期Meta公司发布了一个AI图片学习模型I-JEPA,它是一种基于类人推理的图像自监督学习模型,它可以从单张图像中学习出有用的表示,而不需要使用数据增强或多视图技术。

它可以在抽象表示空间中进行预测和推理,而不是在像素空间中进行生成。它可以在多个计算机视觉任务上表现出强大的性能,并且具有很好的可扩展性和可迁移性。是Meta AI公司首席AI科学家杨立昆(Yann LeCun)提出的一种新型架构的第一个实现,其目标是创建更接近人类智能的AI系统。

自监督学习是什么?

人工智能 (AI) 是当今科技领域最热门的话题之一,它涉及到许多不同的子领域,如计算机视觉、自然语言处理、机器学习等。在这些子领域中,有一个共同的挑战,就是如何让AI系统能够从大量的未标注数据中学习有用的知识和表示,从而提高其在各种任务上的性能和泛化能力。这就是所谓的自监督学习 (self-supervised learning)。

自监督学习是一种机器学习方法,它不依赖于人工标注的数据,而是利用数据本身的结构或属性来生成标签或目标。通过这种方式,自监督学习可以充分利用海量的数据资源,发现其中隐含的模式和规律,从而学习出具有丰富语义和结构信息的表示。这些表示可以作为其他下游任务的输入或特征,提高其效率和准确度。

自监督学习的两种常见方法

在计算机视觉领域,自监督学习主要有两种常见的方法:基于不变性 (invariance-based) 的方法和基于生成 (generative-based) 的方法。基于不变性的方法旨在训练模型在不同视角或变换下对图像进行编码,使得编码后的表示具有一致性或相似性。

这种方法可以捕捉图像中的高层语义信息,但也可能引入一些偏差或失真。基于生成的方法旨在训练模型根据给定的分布生成逼真的图像样本,并间接地学习出有意义的表示。这种方法可以捕捉图像中的低层细节信息,但也可能忽略一些高层语义信息。

新颖的自监督学习模型I-JEPA

为了克服这两种方法的局限性,Meta AI公司最近发布了一种新颖的自监督学习模型,名为I-JEPA (Image Joint Embedding Predictive Architecture)。该模型是基于Meta AI首席AI科学家Yann LeCun提出的一种新型架构,其目标是创建更接近人类智能的AI系统。LeCun认为,要实现这一目标,AI系统需要能够学习内部模型来理解世界是如何运作的,从而能够快速地学习新概念、规划如何完成复杂任务、并适应陌生情况。

I-JEPA是基于LeCun愿景中一个关键组件的第一个AI模型。该模型通过创建一个内部世界模型来进行学习,该模型将图像转换为抽象表示,并比较不同表示之间的相容性或相似性(而不是直接比较像素)。I-JEPA在多个计算机视觉任务上表现出强大的性能,并且比其他广泛使用的计算机视觉模型更具计算效率。

I-JEPA学习到的表示也可以用于许多不同的应用,而不需要进行大量的微调。例如,meta使用16个A100 GPU在不到72小时内训练了一个632M参数的视觉变换器模型,它在ImageNet上的低样本分类任务上达到了最先进的性能,每个类别只需要12个标注样本。其他方法通常需要两到十倍的GPU时间,并且在使用相同数量的数据进行训练时,错误率更高。

I-JEPA有什么优势?

它可以从单张图像中学习出有用的表示,而不需要使用数据增强或多视图技术。这样可以减少计算开销和内存需求,并提高训练效率。

它可以在抽象表示空间中进行预测和推理,而不是在像素空间中进行生成。这样可以避免一些常见的生成错误,如模糊、失真、重复等,并提高语义和结构信息的保留。

它可以在多个计算机视觉任务上表现出强大的性能,并且具有很好的可扩展性和可迁移性。它可以适应不同大小和分辨率的图像,并且可以很容易地适应不同领域或任务。

在以下几个计算机视觉任务上评估了I-JEPA模型:

图像分类 (image classification):给定一张图像,判断它属于哪个类别。

目标检测 (object detection):给定一张图像,找出其中包含哪些物体,并用矩形框标出它们的位置。

实例分割 (instance segmentation):给定一张图像,找出其中包含哪些物体,并用不同颜色的区域标出它们的形状。

图像检索 (image retrieval):给定一张查询图像,从一个图像库中找出与之最相似的图像。

meta将I-JEPA模型与其他一些基于自监督学习的模型进行了比较,包括SimCLR、MoCo、BYOL、SwAV、Barlow Twins等。meta发现,I-JEPA模型在所有任务上都取得了最好或接近最好的结果,证明了它的有效性和通用性。meta还发现,I-JEPA模型可以使用更少的数据和更少的计算资源来达到很好的性能,证明了它的高效性和节约性。

以下是一些实验结果的示例:

图像分类:meta在ImageNet数据集上进行了图像分类实验,该数据集包含1000个类别和140万张图像。meta使用不同数量的标注样本来训练一个线性分类器,并评估其在测试集上的准确率。meta发现,I-JEPA模型在低样本和高样本的情况下都优于其他模型。例如,当每个类别只有12个标注样本时,I-JEPA模型达到了47.1%的准确率,而其他模型的准确率都在40%以下。当每个类别有100个标注样本时,I-JEPA模型达到了72.4%的准确率,而其他模型的准确率都在70%以下。

目标检测:meta在COCO数据集上进行了目标检测实验,该数据集包含80个类别和12万张图像。meta使用一个预训练好的自监督学习模型来初始化一个目标检测器,并在COCO数据集上进行微调。meta使用平均精度 (mAP) 来评估目标检测器在测试集上的性能。meta发现,I-JEPA模型初始化的目标检测器达到了40.9%的mAP,而其他模型初始化的目标检测器的mAP都在39%以下。

实例分割:meta在COCO数据集上进行了实例分割实验,该数据集包含80个类别和12万张图像。meta使用一个预训练好的自监督学习模型来初始化一个实例分割器,并在COCO数据集上进行微调。meta使用平均精度 (mAP) 来评估实例分割器在测试集上的性能。meta发现,I-JEPA模型初始化的实例分割器达到了37.5%的mAP,而其他模型初始化的实例分割器的mAP都在36%以下。

图像检索:meta在CUB-200-2011数据集上进行了图像检索实验,该数据集包含200个鸟类类别和1.2万张图像。meta使用一个预训练好的自监督学习模型来提取图像特征,并使用余弦相似度来计算两张图像之间的相似度。meta使用平均准确率 (mAP) 来评估图像检索系统在测试集上的性能。meta发现,I-JEPA模型提取的图像特征达到了67.3%的mAP,而其他模型提取的图像特征的mAP都在65%以下。

总结

I-JEPA是一种基于类人推理的图像自监督学习模型,它可以从单张图像中学习出有用的表示,而不需要使用数据增强或多视图技术。它可以在抽象表示空间中进行预测和推理,而不是在像素空间中进行生成。它可以在多个计算机视觉任务上表现出强大的性能,并且具有很好的可扩展性和可迁移性。它可以使用更少的数据和更少的计算资源来达到很好的性能。I-JEPA模型是一个重要的里程碑,它为实现更接近人类智能的AI系统提供了一个有力的工具和一个有前景的方向。

THE END
0.AIGC照片以假乱真“眼见”不再“为实”在另一项实验中,研究人员试图帮助测试对象提高辨别AIGC图像的能力。他们在参与者作出回答后即给出每个答案的对错,还让参与者仔细阅读了关于如何辨别AIGC图像的相关建议,以便其提前作好准备。该建议强调了人工智能算法经常出错的一些地方,例如所生成图片中的耳环可能不匹配,或者图片中人物的牙齿没有齿缝而是连成一片,并jvzquC41yy}/ewnk0eun0ls1|ijy{8~y53791;5452?0v;5452?17h:234<70qyon
1.人工智能科技AIgif动图动态图表情包下载SOOGIF为您提供人工智能gif动态图片,科技AI动图表情包下载,还有更多关于人工智能,科技,AI的动图内容,尽在SOOGIF。jvzquC41yy}/uxtikh4dqv4ocvkskjqRcik0XoWlSq>STc^
2.零基础玩转AI壁纸创作:DeepSeek+Picsart精调出图全攻略提示词是AI生成图片的“指南针”,精准的描述能让最终效果更贴近预期。DeepSeek作为一款智能语言模型,能帮我们把模糊的想法转化为专业提示词。 帮我生成一段星空壁纸提示词,希望画面中有银河横跨天际,点缀着明亮的星星,底部有一片静谧的森林剪影,整体色调偏冷,带有梦幻感 jvzquC41i0vdqwqkpg4dqv3ep1~03B;913?79?<550nuou
3.AI照片高清AI摄影图片正版摄影素材网AI照片专题素材由Veer图库精选提供,内容涵盖:AI照片,高清AI摄影照片,可商业AI照片素材等;需要正版AI照片素材下载需求就到Veer图库。jvzquC41yy}/xnjt0eun1}trke55;:61
4.人工智能图片人工智能素材人工智能PNG大全下载AI人工智能光效艺术字 PNGPSD 像素:2000 x 2000格式: PSD 矢量电子科技人工智能底纹元素 PNGAI 像素:2000 x 2000格式: AI 3d风格人工智能机器人免抠素材 PNG 像素:1024 x 1024格式: PNG 未来人工智能图片 PNGPSD 像素:761 x 1037格式: PSD 3D人工智能机器人免抠元素 jvzquC41o0zvm~urv0ipo8xqrpm0tnsiqpm{jrsgpi4ivvq
5.ai图片网|aiPhotoai图片网-免费的无版权图片,免压缩可免登录免费下载,ai图片集风景动物科技人像类图片集合站jvzquC41ckviq}t0tc6/ew4
6.掌握AI人工智能技巧,提升图像处理水平摘要:本文主要探讨如何利用AI人工智能技巧来提升图像处理水平。从AI在图像处理中的核心概念入手,逐步讲解其算法原理、操作步骤,还通过项目实战展示具体应用,介绍了实际应用场景、相关工具资源,分析未来发展趋势与挑战。旨在帮助读者全面了解并掌握利用AI提升图像处理能力的方法。 背景介绍 目的和范围 目的是让读者了解如何借助AI人工智能的技巧来jvzquC41dnuh0lxfp0tfv8|gkzooa>6;82?5;8ftvkimg8igvcomu866;294:@<
7.ai科技图片大全ai科技高清图片下载AI主题海报底图AI科技素材 健康保险概念医院医生与健康保险相关的图标图形界面医疗平台 AI蓝色科技智能芯片半导体CPU科技背景 无人机在城市上俯视 自动机器人白色背景 白色背景上一个可爱的机器人打招呼有趣的机器人逗留显示你好 3D可爱的小型机器人未来科技AI人工智能 jvzquC41yy}/7:rk|0ipo8xq/v{qkjs13894;?90jvsm
8.AI篇如何用AI辅助对图片进行鉴赏图片分析ai文章介绍了如何通过文心一言分析图片,包括观众侧鉴赏图片的方法,强调了正确的方式是提供图片简介。文章还探讨了作者侧鉴赏图片,即通过AI辅助理解作者的情感表达。最后总结了AI在图片鉴赏中的应用策略,即配合提示语以获得更准确的解读。 前言 目录 前言 一、观众侧鉴赏图片 jvzquC41dnuh0lxfp0tfv8Rtayomuxsank{0c{ykenk0fnyckny03<8;97=12