CLASSES = np.array(
"airplane",
"automobile",
"bird",
"cat",
"deer",
"dog",
"frog",
"horse",
"ship",
"truck",
preds = model.predict(x_test)
preds_single = CLASSES[np.argmax(preds, axis=-1)]
actual_single = CLASSES[np.argmax(y_test, axis=-1)]
preds
是一个形状为 [10000, 10]
的数组,即每个观测样本对应一个包含 10
个类别概率的向量。
使用 numpy
的 argmax
函数将这个概率数组转换回单个预测结果。其中,使用 axis = -1
指定数组在最后一个维度(即类别维度)上压缩,因此 preds_single
的形状为 [10000, 1]
。
我们可以使用以下代码查看图片以及它们的标签和预测结果:
n_to_show = 10
indices = np.random.choice(range(len(x_test)), n_to_show)
fig = plt.figure(figsize=(15, 3))
fig.subplots_adjust(hspace=0.4, wspace=0.4)
for i, idx in enumerate(indices):
img = x_test[idx]
ax = fig.add_subplot(1, n_to_show, i + 1)
ax.axis("off")
ax.text(
0.5,
-0.35,
"pred = " + str(preds_single[idx]),
fontsize=10,
ha="center",
transform=ax.transAxes,
ax.text(
0.5,
-0.7,
"act = " + str(actual_single[idx]),
fontsize=10,
ha="center",
transform=ax.transAxes,
ax.imshow(img)
plt.show()
下图展示了模型的对随机选择数据的预测结果及其真实标签:
深度学习是一种机器学习算法,它通过构建多层神经网络模型,自动地从输入数据中进行特征学习,并输出对应的预测结果。深度神经网络是构建生成模型的基础,几乎所有复杂的生成模型都以深度神经网络为核心。构建生成模型时,其核心思想在于正确组合损失函数、激活函数和层形状等。在本节中,介绍了生成模型与深度学习之间的联系,以及深度神经网络模型中的各种基本组件,并使用 Keras
构建了一个简单的多层感知器。
AIGC实战——生成模型简介
AIGC实战——卷积神经网络(Convolutional Neural Network, CNN)
AIGC实战——自编码器(Autoencoder)
AIGC实战——变分自编码器(Variational Autoencoder, VAE)
AIGC实战——使用变分自编码器生成面部图像
AIGC实战——生成对抗网络(Generative Adversarial Network, GAN)
AIGC实战——WGAN(Wasserstein GAN)
AIGC实战——条件生成对抗网络(Conditional Generative Adversarial Net, CGAN)
AIGC实战——自回归模型(Autoregressive Model)
AIGC实战——改进循环神经网络
AIGC实战——像素卷积神经网络(PixelCNN)
AIGC实战——归一化流模型(Normalizing Flow Model)
AIGC实战——能量模型(Energy-Based Model)
Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得。Key Words:有监督学习与无监督学习,分类、回归,密度估计、聚类,深度学习,Sparse DBN,1. 有监督学习和无监督学习给定一组数据(input,target)为Z=(X,Y)。有监督学习:最常见的是r
美观性、风格化和可控性是时下流行的 文成图 面临的三座大山,所谓美观性,指的是符合美学规则,不能有脸部畸变、等瑕疵;所谓风格化,指的是有动漫、二次元等多种多样的分割;所谓可控性,指的是可以自由、轻松的控制生成图片中人物的性别、年龄、质态、种族、服装以及场景、光线等的能力. SDXL大幅提升了出图的质量,再也不需要冗长的咒语才能生成差强人意的图片;Lora仅需要数十张目标人物的图就可以高质量的生成特定人物;ControlNet大幅提升了对于姿态、线条等的控制能力
人工智能(AI)是指将机器或计算机程序赋予类似于人类智能的能力,即可以像人一样感知、理解、学习、推理和创造。
* 机器学习(Machine Learning,简称ML)是人工智能中的一种方法和技术,通过让计算机从数据中学习模式和规律,从而不需要人类明确地编写特定的程序来完成任务。
* 深度学习(Deep Learning)是一种基于人工神经网络的机器学习技术,通过模拟人脑神经元之间的联系和活动方式,来实现对输入数据进行分析、抽象和处理的能力。
AIGC(Artificial Intelligence Generated Content)生成式 AI,或 AI生成内容,即利用AI技术自动生产内容。与之相对的是PGC(Professionally Generated Content)专业生成内容、和UGC(User Generated Content)用户生成内容。从 PGC 到 UGC 再到 AIGC,生产内容以指数速度增长。
生成式人工智能(AIGC)究竟是怎么运作的呢?在这篇文章里,我们就来简单了解一下生成式人工智能技术(AIGC)的基本原理,看看它到底能做些什么,还有啥时候你可能不太想依赖它。
深度学习是包含多个隐层的机器学习模型,核心是基于训练的方式,从海量数据中挖掘有用信息,实现分类与预测。
早期的深度学习模型:编码器、循环神经网络、深度置信网络、卷积神经网络
衍生模型:堆叠降噪自编码器、稀疏自编码器、降噪自编码器
深度学习的常用模型:卷积神经网络(CNN),深度信念网络(DBN),深度自动编码器(DAE),限制玻尔兹曼机(RBM)。CNN有全监督学习和权值共享的特点,在自然语言处理和语音图像识别领域有很强优势。其他深度学习模型大多先采用无监督方式逐层预训练,再使用有...
AIGC(AI Generated Content)技术,即人工智能生成内容的技术,具有非常广阔的发展前景。随着技术的不断进步,AIGC的应用范围和影响力都将显著扩大。以下是一些关于AIGC技术发展前景的预测和展望:1、AIGC技术将使得内容创造过程更加自动化,包括文章、报告、音乐、艺术作品等。这将极大地提高内容生产的效率,降低成本。2、在游戏、电影和虚拟现实等领域,AIGC技术将能够创造更加丰富和沉浸式的体验,推动娱乐产业的创新。
文本向量和图像向量可以建立成N×N的矩阵关系,如下图所示,当处于对角线的向量乘积,因为i=j,余弦相似度是最大的(cos0为1);不在对角线上的向量成绩,因为i≠j,余弦相似度最小。利用图文的特征 encoder 分别获取图像和文本的特征,然后构成了一个 NxN 的一个相似度矩阵,其中对角线上的图文对是正样本,此外的 N^2 - N 是负样本,通过对每行 image->text 做交叉熵 loss,每列 text->image 做交叉熵loss,目标就是优化这两个 loss 之和。
AIGC是人工智能、大数据、云计算和5G等技术的融合,也是当前的一门“显学”,不懂AIGC,都不好意思说自己是学计算机的,搞IT的。面对快速发展的AIGC前沿技术,大学生来说想要入门AIGC,要学哪些方面的知识和技术呢?
1. 什么是 AIGC"AIGC"代表人工智能生成内容(Artificial Intelligence Generated Content)这个概念指的是利用人工智能技术,特别是自然语言处理(NLP)、机器学习和深度学习等技术,来生成各种形式的内容,如文章、音乐、图片、视频等。AIGC的应用领域非常广泛,包括新闻报道、广告...