大模型学习笔记之四：生成式人工智能是如何工作的|ai时代学什么怎么学 pdf_AI时代

开通VIP，畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

GPT-4多模态分析对话

Midjunery和DALL·E 这样的AI绘图软件可以通过Prompt 输入文本提示生成多张令人惊艳的美图，看起来相当神奇。

Midjunery V6

但是，你有没有想过，生成式人工智能（AIGC）究竟是怎么运作的呢？在这篇文章里，我们就来简单了解一下生成式人工智能技术（AIGC）的基本原理，看看它到底能做些什么，还有啥时候你可能不太想依赖它。'

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

大多数传统类型的人工智能（如判别式人工智能）都是为了对现有数据进行分类或归类而设计的。相反，生成式人工智能模型的目标是生成前所未见的完全原创的人工制品。

在今天，有监督学习（Supervised Learning）和生成式人工智能（Generative Artificial Intelligence）是当今人工智能领域的两个最重要领域，其重点是创建算法和模型，以便从训练数据集生成与模式相似的新的真实数据。

AI 学习框架

生成式人工智能模型经过训练，可以从庞大的数据集中学习其中的潜在模式，并使用该知识生成与原始数据集相似但不相同的全新样本或数据。

Midjunery V6 生成的人像

例如，在人类或者猫狗的图像数据集上训练的生成式人工智能算法可以生成全新的人类图像或者猫和狗的图像，这些图像看起来与原始数据集中的图像相似，但不是精确的复制品。因此，'生成 '一词被用来描述它。

生成式人工智能（Generative AI）的涌现标志着人工智能技术的重大进步。

1.1 有监督学习的局限性与挑战

在2010年左右，随着大规模有监督学习逐渐成为主流，人们开始寄希望于大数据能够为AI模型的性能带来质的飞跃。

然而，从那时起，AI 科学家们开始观察到一个令人困扰的问题：尽管我们有大量的数据可供使用，但即使我们向小型AI模型继续提供更多的数据，它们的性能改善并不明显。

例如，在构建语音识别系统时，尽管AI接受了数千乃至数十万小时的训练数据，但其准确性与仅使用少量数据的系统相比并无显著提高。这一现象引发了人们对监督学习有效性的怀疑。

有监督学习的基本流程

进一步的研究表明，仅靠大规模监督学习和大数据集并不能无限地提升 AI 模型的准确性。

这是因为：

1.2 生成式人工智能的出现

随着人们对监督学习的限制和挑战有了更深入的认识，研究人员开始寻求其他方法来克服这些问题。在这个过程中，生成式人工智能（Generative Artificial Intelligence）应运而生，并逐渐成为人工智能领域的重要组成部分。

生成式人工智能（AIGC）与传统的机器学习算法不同，它不仅仅局限于对已有数据的分类或预测，而是可以通过学习数据的分布，创造出全新的、以前从未见过的内容，它能够像一座神奇的创意工厂一样，通过Prompt 提示词不断地生产出令人惊叹的全新数据、图像、音频和文本内容。

生成式人工智能与其他类型人工智能之间的另一个关键区别是，生成式人工智能模型通常使用无监督和半监督机器学习算法。

无监督学习的基本流程

这意味着它们不需要对学习的数据进行预先标记，这使得生成式人工智能在结构化或组织数据稀缺或难以获取的应用中特别有用。

生成式人工智能的出现为人工智能领域带来了新的思路和解决方案，克服了传统监督学习方法的一些限制和挑战。通过结合生成式方法和传统的监督学习技术，我们可以更好地利用数据，提高模型的性能和泛化能力。

二、生成式人工智能的思想

2.1 生成式人工智能的基本工作原理：

生成式人工智能的基本工作原理是通过学习数据的分布特征，从而能够生成与原始数据相似的新数据。其核心思想是从训练数据中学习数据的概率分布，并使用学习到的分布模型来生成新的数据样本。

生成式人工智能通常采用生成对抗网络（GANs）或变分自编码器（VAEs）、Transformer 等模型来实现。

就拿生成对抗网络（GANs）来说，GANs 模型包括两个主要组成部分：

生成对抗网络工作机制（GANs）

1. 生成器（Generator）：生成器是一个神经网络模型，用来接收一个随机噪声向量或其他形式的输入，并将其映射到数据空间。生成器的目标是通过根据用户输入的分析数据模式来创建新数据。通过不断调整生成器的参数，使得生成的样本尽可能地接近真实场景中的数据分布。

2. 判别器（Discriminator）：判别器也是一个神经网络模型，其任务是对生成器生成的样本与真实数据进行区分，估计样本来自于训练数据的概率。它接收来自生成器产生的样本和真实数据的输入，并尝试将它们分类为真实或伪造。判别器的目标是最大化正确地将真实数据分类为真实样本，同时将生成的样本正确分类为伪造样本。

每当有用户输入时，生成器就会生成新的数据，判别器将分析它的真实性。来自判别器的反馈使算法能够调整生成器参数并不断地重新调整和细化输出。

在数学上可以证明，在任意函数的生成器（G）和判别器（D）空间中，存在唯一的解决方案，使得生成器（Generator）生成的内容可以重现真实训练数据的分布，也就是当判别器 D=0.5 时，生成器 G 产生的信息与输入的信息达到平衡。

生成对抗网络的工作过程

通过训练生成器和判别器的对抗过程，生成式人工智能模型不断地提高生成样本的质量，使得生成的样本更加逼真，并且与真实数据的分布更加接近。

这种对抗性训练的过程使得生成器和判别器之间达到一种平衡，最终这个过程一直持续到生成器产生与输入信息无法区分的数据为止。

2.2 生成式人工智能的工作过程

生成式人工智能的工作过程通常如下：

生成式AI的工作过程

三、如何评估生成式人工智能模型

选择正确的模型对于某些特定的任务至关重要，因为每个任务都有其独特的需求和目标，而不同的生成式人工智能模型也各有其优缺点。

比如，某一些模型可能比较擅长生成高质量的图像内容，而另一些模型则更擅长生成顺畅连贯的文本内容。

因此在选择时，需要重视对生成模型进行评估以确定最适合特定任务的模型。这种评估不仅有助于选择正确的模型，还有助于确定需要改进的方面。

在评估模型时，通常需要考虑三个关键要素：

评估模型的三要素

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

#artContent h1{font-size:16px;font-weight: 400;}

THE END

大模型学习笔记之四：生成式人工智能是如何工作的

秒懂智能体：gent重新定义未来工作pdfmobiepubtxt百度云盘百度网盘免费下载电子书下载电子版全集免费阅读在线阅读精校版扫描阿里云盘indle资源edk

得到学习圈年度合集pdf

大模型学习笔记之四：生成式人工智能是如何工作的

知识图谱知识图谱gentpdf

人工智能系列套装册人工智能智能时代终极算法智能革命人工智能的未来pdfepubmobitxt电子书下载

专题：时代，学什么，怎么学教育能力

产品经理进化论：时代产品经理的思维方法pdfepubmobitxt电子书下载