SRGAN图像超分重建算法Python实现（含数据集代码）


           
            
             
              
               在SRGAN模型中，SRResNet是核心的一部分，也就是生成器模型。生成器的任务是从低分辨率图像生成高分辨率图像。以下是 SRResNet 模型的主要结构:
              
             
            
           
           
            
             
              
               
                
                 第一卷积块（conv_block1）：这个模块用于接收输入的低分辨率图像，并进行初始的特征提取。这里使用了预激活的ReLU (PReLU) 作为激活函数，并且不使用批归一化。卷积核的大小是大核大小(large_kernel_size)，默认为9。
                
               
              
             




    

            
            
             
              
               
                
                 残差块（residual_blocks）：这是一系列的残差模块。每个残差模块都包含两个卷积层和一个跳跃连接。这里默认使用了16个残差模块。
                
               
              
             
            
            
             
              
               
                
                 第二卷积块（conv_block2）：这个模块用于提取特征图的更深层次的信息。这里使用了批归一化和ReLU激活函数，但是没有使用偏置项。
                
               
              
             
            
            
             
              
               
                
                 子像素卷积块（subpixel_convolutional_blocks）：这些模块用于将图像放大到目标的高分辨率。每个子像素卷积模块都能将图像的分辨率放大两倍。根据我们设置的放大比例(scaling_factor)，可能会有多个子像素卷积模块串联在一起。
                
               
              
             
            
            
             
              
               
                
                 最后的卷积块（conv_block3）：这个模块用于生成最后的高分辨率图像。这里使用了tanh作为激活函数，可以将像素值约束在-1到1之间。
                
               
              
             
            
           
           
            
             
              
               其中forward 函数描述了模型的前向传播过程。首先，我们通过第一卷积块处理输入的低分辨率图像，然后将结果保存在residual变量中，作为跳跃连接的参考。将处理后的结果送入残差模块进行特征提取和非线性变换。然后再次使用卷积操作对特征图进行处理，并将结果与residual变量相加，实现了特征图的跳跃连接。通过子像素卷积模块进行上采样操作，将图像的分辨率提升到目标的高分辨率。最后通过最后的卷积块生成最终的高分辨率图像。
              
             
            
           
           
            
             
              
               

              
             
            
           
           
            
             
              
               
                
                 3.1 生成器模型代码
                
               
              
             
            
           
           
            
             
              
               生成器（Generator）模型是 SRGAN 中的一个关键部分，其核心任务是从低分辨率图像生成高分辨率图像。在这段代码中，生成器的结构与 SRResNet 完全一致，其主要代码如下：
              
             
            
           
           
            

           

           
            
             
              
               
                以上代码将 SRResNet 作为一个内部网络 (self.net)，并在 forward 方法中调用它来执行超分辨率转换，包括以下生成器模型的主要部分：
               
              
             
            
           
           
            
             
              
               
                （1）内部网络（net）：这个模块是我们之前定义的 SRResNet 模型。其参数，如大核尺寸（large_kernel_size）、小核尺寸（small_kernel_size）、通道数（n_channels）、残差模块数量（n_blocks）和放大比例（scaling_factor），都会直接传递给 SRResNet 模型。
               
              
             
            
           
           
            
             
              
               
                （2）forward 方法描述了模型的前向传播过程。它接收低分辨率图像，然后通过 SRResNet 模型生成超分辨率图像。其中，lr_imgs 是输入的低分辨率图像，形状为 (N, 3, w, h)；sr_imgs 是输出的超分辨率图像，形状为 (N, 3, w * scaling_factor, h * scaling_factor)。
               
              
             
            
           
           
            
             
              
               
                

               
              
             
            
           
           
            
             
              
               
                
                 
                  3.2 判别器模型代码
                 
                
               
              
             
            
           
           
            
             
              
               
                判别器（Discriminator）是 SRGAN 模型的另一个关键部分，其任务是判断输入图像是否为真实的高分辨率图像。在训练过程中，判别器和生成器进行博弈，共同推动模型的进步，其主要代码如下：
               
              
             
            
           
           
            

           

           
            
             
              
               
                
                 在以上代码中，定义了判别器模型的主要部分：
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   卷积块序列（conv_blocks）：这是一个由多个卷积块组成的序列。每个卷积块都包含一个卷积层，然后可能跟随一个批归一化层，最后是一个LeakyReLU 激活函数。这些卷积块的参数（比如卷积核大小、输入/输出通道数、是否使用批归一化等）都是根据 SRGAN论文中的说明进行设置的。
                  
                 
                
               
              
             
            
            
             
              
               
                
                 
                  
                   自适应平均池化层（adaptive_pool）：这一层的作用是将卷积块序列的输出调整到固定的大小（6x6），以便接下来可以连接全连接层。
                  
                 
                
               
              
             
            
            
             
              
               
                
                 
                  
                   全连接层（fc1和fc2）：第一个全连接层（fc1）用于将自适应平均池化层的输出扁平化，并通过线性变换降低维度到指定的尺寸（fc_size，这里设置为1024）。然后经过LeakyReLU激活函数，再连接到第二个全连接层（fc2），最终输出一个分数值，用于判断输入的图像是否为真实的高分辨率图像。
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 forward 函数描述了模型的前向传播过程。它接收输入的图像，首先经过卷积块序列进行特征提取，然后经过自适应平均池化层将特征调整到固定的大小，接着通过两个全连接层输出一个评分值。其中，imgs 是输入的图像，形状为 (N, 3, w * scaling_factor, h * scaling_factor)；logit 是输出的评分值，形状为 (N)。
                
               
              
             
            
           
           
            
             
              
               
                
                 需要注意的是，这里并没有在模型的最后添加 Sigmoid 层，因为在计算损失时，我们会使用 PyTorch 的 nn.BCEWithLogitsLoss() 函数，这个函数内部已经包含了 Sigmoid 函数的计算步骤。
                
               
              
             
            
           
           
            
             
              
               
                
                 

                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   3.3 测试生成图像代码
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 以下代码介绍了如何使用训练好的 SRGAN 生成器模型进行图像的超分辨率恢复。先贴上代码然后我后面再详细解释这个过程：
                
               
              
             
            
           
           
            
           
           
            
             
              
               
                
                 
                  以上代码给出了如何使用 SRGAN 进行图像超分辨率恢复的整个过程，你可以通过改变测试图像或模型的参数来看看模型的效果如何变化，这段代码包括了以下环节。
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   
                    设置参数：首先定义了一些模型和测试图像的参数，包括图像的路径，模型的参数（如卷积核大小，通道数，残差模块数量和放大比例等）和设备（优先使用 GPU，如果没有则使用 CPU）。
                   
                  
                 
                
               
              
             
            
            
             
              
               
                
                 
                  
                   
                    加载模型：使用 torch.load() 函数加载预训练的 SRGAN 模型，并把模型移到相应的设备上。之后设置模型为评估模式，这意味着模型中的某些层（如批归一化和丢弃）会根据需要更改行为。
                   
                  
                 
                
               
              
             




    

            
            
             
              
               
                
                 
                  
                   
                    加载和处理图像：使用 PIL 库加载测试图像，并将其转换为 RGB 格式。然后使用双线性插值方法将图像大小调整到目标大小，并保存结果。接下来，对图像进行预处理，将其从 PIL 图像转换为适合模型输入的张量，并增加一个批处理维度。
                   
                  
                 
                
               
              
             
            
            
             
              
               
                
                 
                  
                   
                    模型推理：首先记录推理开始的时间，然后将预处理后的图像移到相应的设备上。然后，使用 torch.no_grad() 上下文管理器禁止梯度计算（因为在推理过程中不需要计算梯度，这样可以节省内存），并将图像输入模型进行超分辨率恢复。最后，将模型输出的张量转换回 PIL 图像，并保存结果。
                   
                  
                 
                
               
              
             
            
            
             
              
               
                
                 
                  
                   
                    打印推理时间：计算模型推理的时间，并打印结果。
                   
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  运行出来的结果如下图所示，可以对比一下效果，当然不同的图片可能恢复的效果不一样。
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                  
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   4. 下载链接
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  若您想获得博文中涉及的实现完整全部程序文件（包括测试图片、视频，py文件等，如下图），这里已打包上传至博主的csdn下载频道获取。
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   完整代码下载地址
                  
                  ：https://download.csdn.net/download/qq_32892383/87953641
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   COCO训练数据集
                  
                  ：https://pan.baidu.com/s/18xiqkK2m34TKo1FcKo0RJw?pwd=y5gf
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  提取码：y5gf
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                  
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                     Python版本：3.8
                    
                   
                   ，
                   
                    请勿使用其他版本，需要安装的依赖请见requirements.txt文件
                   
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  安装环境步骤如下：
                  

                  （1）首先打开系统的cmd终端（不要用powershell），使用以下命令将命令行路径切换到你的代码所在的文件夹（…/你的路径/SRGAN）下：
                 
                
               
              
             
            
           
           
            
           
           
            
             
              
               
                
                 
                  
                   上面我的代码在G盘，你应该切换到自己的文件夹路径，然后再次输入"G:"命令防止没切换过来：
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   （2）输入conda命令创建一个python 3.8的环境，代码如下：
                  
                 
                
               
              
             
            
           
           
            
           
           
            
             
              
               
                
                 
                  
                   
                    等待环境创建完毕后，使用以下命令激活环境：
                   
                  
                 
                
               
              
             
            
           
           
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                     （3）激活环境后可以使用pip读取requirements.txt中的依赖库版本进行安装：
                    
                   
                  
                 
                
               
              
             
            
           
           
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                     
                      等待完全安装完毕，此时你可以在pycharm的环境配置中选择刚刚新建的环境运行了。
                      
                       如果需要重新训练模型，你需要先下载COCO数据集然后解压到SRGAN文件夹下的data文件夹中
                      
                      ，我已经打包好该数据集其网盘地址如下：
                      

                     
                    
                   
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                     
                      
                      
                      
                     
                    
                   
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                     
                      
                     
                    
                   
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                     
                      
                       
                        结束语
                       
                      
                     
                    
                   
                  
                 
                
               
              
             
            
           
           
            
             
              
               
                
                 
                  
                   
                    
                     
                      由于博主能力有限，博文中提及的方法即使经过试验，也难免会有疏漏之处。希望您能热心指出其中的错误，以便下次修改时能以一个更完美更严谨的样子，呈现在大家面前。同时如果有更好的实现方法也请您不吝赐教。
SRGAN图像超分重建算法Python实现（含数据集代码）

前言

1.实现原理

2.SRGAN 原理与代码实现

3. 代码编写

4. 下载链接

结束语