本刊信息

主 管 单 位: 重庆市教育委员会

主 办 单 位: 重庆工商大学

编 辑 出 版: 《重庆工商大学学报(自然科学版)》编辑部

邮 发 代 号: 78-114

邮政编码:400067

联系电话:023-62769495

国际标准刊号:ISSN 1672-058X

国内统一刊号:CN 50-1155

新闻动态
  • 1
  • 2024年《重庆工商大学学报(自然科学版)》影响因子显著提升

当期目录
显示方式:
  • 基于多尺度下采样的遥感图像目标检测算法

    周华平, 刘伟东

    2025, DOI:

    Abstract:

    目的 针对现有遥感图像目标检测算法在目标尺度变化大以及存在复杂背景信息干扰的场景中检测精度不 佳的问题,提出一种基于多尺度下采样的遥感图像目标检测算法 MSD-YOLO( Multi-Scale Downsampling-YOLO) 。 方法 首先设计一种多尺度下采样( Multi-Scale Downsampling, MSD) 模块,通过 3 个并行下采样分支在进行下采样 的同时实现多尺度特征提取,避免了现有模型在经过多次下采样后,小目标特征信息丢失严重的问题,并引入具有 自适应激活特性的 ACON( Activate or Not) 激活函数,提升模型泛化能力;其次对三重注意力( Triplet Attention) 机制 进行改进,提出 ITA( Improved Triplet Attention) 机制,通过捕获跨维度交互并强调空间注意力自适应地调整特征图 的权重分配,提升模型在复杂背景信息干扰场景中的检测性能。 结果 实验结果表明:MSD-YOLO 在 NWPU VHR- 10 及 RSOD 数据集上的平均精度( mAP) 分别达到 94. 9%及 96. 8%,相较于基线网络 YOLOv7,均提升了 1. 5%,并 且精度优于其他经典网络模型。 结论 提出的 MSD-YOLO 算法可以有效提升在尺度变化大以及存在复杂背景信息 干扰等场景中的检测精度,在遥感图像目标检测场景中有着一定的应用价值。

  • 基于双判别器的 Wasserstein 生成对抗网络图像修复

    李筱玉, 张 乾, 徐开丽, 骆 迪, 冉娅琴

    2025, DOI:

    Abstract:

    目的 针对基于生成对抗网络的图像修复模型,在修复不规则大面积缺损图像时,存在细节特征信息还原不 准确、图像视觉效果欠佳及训练不稳定等缺陷问题,提出了一种基于双判别器的 Wasserstein 生成对抗网络图像修 复模型。 方法 该方法首先以编码器-解码器结构的卷积神经网络作为生成器,在生成器的编码器和解码器之间添 加跳跃连接,以更好地学习图像细微特征并提升最终的修复效果;接着在全局判别器基础上引入局部判别网络,以 保证局部修复结果与周围区域的一致性,并在判别器中引入 Wasserstein 距离,从而使网络的训练更加稳定以获得 较为自然的图像修复效果;最后设计 VGG16 特征提取器以引入感知损失和风格损失,通过添加多个损失函数来提 升图像复原效果。 结果 在公开人脸、场景和街景数据集上进行对比分析,验证出所提出的方法定性和定量分析结 果均优于对比模型,其性能评价指标值更高。 结论 实验结果表明:所提出的方法在修复不规则大面积缺损区域的 图像时,修复图像更清新,视觉效果更好。

  • 面向遥感图像场景分类的轻量级沙漏密集网络

    刘向举, 吴文彦, 蒋社想

    2025, DOI:

    Abstract:

    目的 在具有复杂空间结构和地理布局的遥感图像场景分类任务中,深度卷积神经网络( CNNs) 虽然具有更 好的分类性能,但是通常具有高复杂度,存在不适用于移动或嵌入式设备等问题,针对此,提出一种新的轻量级沙 漏密集网络( LHD-NET) ,以实现分类精度和模型复杂性之间的良好平衡。 方法 首先通过具有特征补偿机制的浅 层混合下采样结构提取浅层信息,在保证信息充分提取的同时减少后续层的参数数量,从而在保持模型轻量级的 同时提高性能;然后在沙漏结构间采用密集连接以提高特征复用,在一定程度上避免了梯度消失,促进了信息传 递;最后利用一个具有较高语义信息的卷积层特征来指导多层特征聚合,以此来提高分类器的性能,同时训练过程 中采用基于标签平滑的交叉熵损失函数,对真实标签进行平滑处理,相比于普通交叉熵损失函数能够有效提高鲁 棒性和减轻模型过拟合问题。 结果 实 验 结 果 表 明: 该 模 型 在 5. 4 M 参 数 量 下 取 得 了 显 著 的 分 类 性 能, 在 UC Merced Land-Use、SIRI-WHU 和 NWPU-RESISC45 3 个公开遥感数据集上分别取得了 99. 19%、97. 75%和 92. 38% 的平均分类准确率。 结论 通过实验结果可证明所提模型能够在少量参数下便取得较好分类性能,相较于深度神经网 络在保持高分类精度的前提下能显著降低模型参数量,对遥感图像场景分类任务及模型轻量化具有一定的参考价值。 关键词:遥感图像;场景分类;轻量级;卷积神经网络

  • 基于掩蔽图像一致性的无源领域自适应算法研究

    刘二虎

    2025, DOI:

    Abstract:

    目的 无监督领域自适应( Unsupervised Domain Adaptation, UDA) 旨在将有标签源域中的知识适应到没有任 何标签的目标域中,使得目标任务同样表现良好。 针对以前的 UDA 方法存在隐私泄露风险以及容易在目标域中 具有相似视觉外观的类之间产生混淆的问题,提出一种基于掩蔽图像一致性的无源领域自适应算法, 称为掩蔽假 设迁移( Masked Hypothesis Transfer, MHT) 。 方法 MHT 采用假设迁移( Hypothesis Transfer, HT) 思想,冻结源模型 的分类器模块( 假设) ,通过信息最大化和自监督伪标记来学习目标特征提取器,以隐式地对齐目标域与源域的表 示;此外,还提出一个掩蔽图像一致性 ( Masked Image Consistency, MIC) 模块,显式迫使模型学习目标域的空间上 下文关系来增强假设迁移( HT) ,MIC 强迫掩蔽目标图像的预测和伪标签之间的一致性,就必须学会从被掩蔽区域 的上下文中推断其预测。 结果 该算法在闭集 UDA、部分集 UDA 和多源 UDA 3 种适应设置下,在 4 个公共基准上 进行了广泛的测试, 其中在 VisDA - C 上达到了 87. 6% 的准确率, 比 SHOT 高 5. 3%, 在 Office - Home 上达到了 72. 6%的准确率,比 SHOT 高 0. 9%。 结论 实验结果表明: 掩蔽图像一致性目标可以作为额外的线索增强无源领域 自适应,MHT 优于其他对比方法。

  • 基于即插即用的盲二值图像去模糊算法

    杨雪松, 何亮田

    2025, DOI:

    Abstract:

    目的 一类特殊的图像在数字系统中扮演着重要的角色,如文本、条形码和指纹图像,这类图像的主要特征 是它们的像素值只能在一个二值集合中取值。 针对含有加性噪声和运动模糊的此类图像的恢复问题,提出一种新 的基于即插即用框架下的盲图像云运动模糊算法。 方法 在盲去模糊模型中结合了去噪器先验和二值先验知识,它 在利用先进去噪器( 如数据驱动的去噪器) 的同时使恢复的潜在图像具备二值特征。 通过提高潜在图像的恢复质 量,进一步改善估计模糊核的准确性,从而提升最终的恢复结果。 此外,为了进一步增强恢复图像的像素值分布特 性,通过对恢复的图像应用阈值化操作,限制恢复图像的像素值分布在特定的二值集合中。 结果 大量的数值实验 结果表明:该方法在处理含有噪声的运动模糊二值图像的任务中具有较好的应用效果,其性能优于现有的传统算 法。 结论 结合去噪器先验和二值先验知识的盲去模糊算法能够有效地恢复含加性噪声的运动模糊二值图像。

  • YOLOv8-SSDW:基于 YOLOv8 的带钢表面缺陷检测算法

    戴林华, 黎远松, 石 睿

    2025, DOI:

    Abstract:

    目的 针对现有带钢表面缺陷检测精度较低、存在漏检和误检等问题,提出了一种改进 YOLOv8 的缺陷检测 算法 YOLOv8 - SSDW。 方 法 该 算 法 以 YOLOv8n 为 基 准 模 型, 在 骨 干 网 络 结 构 中 引 入 SKNet ( Selective Kernel Networks) 注意力模块,加强骨干网络的特征提取能力和自适应能力,使网络在特征提取过程中更关注缺陷目标;同 时,在 YOLOv8 的颈部使用 Slim-Neck 结构,减少模型的参数量和计算量;为进一步提升网络的特征提取能力,提 出一种融合可变形卷积,强化对缺陷目标的特征学习;考虑缺陷样本质量不平衡问题,使用 WIoU( wise intersection over union) 损失函数,其梯度增益分配策略使问题得到有效改善,并且提高模型收敛速度和回归精度。 结果 改进 后的模型在带钢数据集上进行实验,结果表明:改进后的模型的平均精度达到 85. 5%,相比基准模型提高了 2. 7%。 结论 通过大量实验可以证明改进网络的有效性,改善了带钢表面缺陷检测精度较低的问题,减少了漏检和误检的 情况,同时满足实时性要求;相较于目前主流模型,该改进算法在检测精度具有一定优势,对后续研究用于实际检 测具有参考价值。

  • 基于多视角的面颈部点云配准算法研究

    黄天齐1 , 严 楠1, 2 , 戴家树1 , 李萌阳1

    2025, DOI:

    Abstract:

    目的 为了解决非刚性配准算法在面颈部三维重建中的变形问题,设计了一种面颈部点云的采集方式,并提 出了一种相适应的局部配准再还原全局的配准算法。 方法 采集方式为深度相机分别对准头部右下颌角、左下颌角 和鼻梁 3 个位置采集点云,对采集的 3 片点云进行预处理,把点云 RGB 信息转为 HSV( Hue, Saturation, Value) 后, 定位嘴唇的位置,分割面部后留下鼻子和嘴巴区域,对其采用结合三维形状上下文特征(3DSC) 的随机采样一致性 算法( RANSAC) 进行粗配准,再使用迭代最近点算法( ICP) 进行精配准。 最后,把局部配准得到的变换矩阵应用于 原始点云上,从而得到面颈部三维点云模型。 结果 经过实验,设计的 3 个位置采集的点云能够完整覆盖整个面颈 部区域。 通过对比 5 种改进的迭代最近点配准算法,得到使用 3DSC+RANSAC+ICP 算法进行配准精度最高。 通过 设定面颈部标记点和采集不同人脸进行配准实验,对比了配准结果和真实人脸的标记点距离,结果误差均小于 2. 5 mm,验证了算法的配准精度和配准算法的鲁棒性。 结论 设计的多视角面颈部配准算法能有效配准,配准结果与真 实人脸误差小于 2. 5 mm,解决了非刚性配准算法在面颈部三维重建上的变形问题,在处理不同个体的面颈部数据 时表现出了一定的鲁棒性。

  • 基于多特征信息融合的疲劳驾驶检测算法

    张兴旺1, 2 , 王凤随1, 2 , 杨海燕1, 2

    2025, DOI:

    Abstract:

    目的 针对目前驾驶员疲劳驾驶检测不能兼顾检测速度与检测准确率的问题,提出一种基于 YOLOv7 改进模 型的疲劳驾驶检测算法。 方法 首先,为提高模型的收敛速度,增强模型的检测性能,算法将传统的卷积层替换为深 度过度参数化卷积层,通过增加可学习的参数加快拟合过程;其次,针对存在遮挡目标的场景,传统下采样过程容 易导致特征丢失严重,为提高对遮挡目标检测的准确性,算法引入了基于 SE 注意力改进的 DS-Conv 模块;再次, 为了提高模型对小目标的检测能力,算法在特征提取层中添加了多尺度特征提取 MSS 注意力模块,能够在不同尺 度上捕捉目标的细节和上下文信息;最后,在检测出的人脸上根据 PERCLOS 准则进行疲劳驾驶判定。 结果 实验 结果表明:改进算法在 WIDER FACE 数据集的 Easy、Medium、Hard 子集上分别达到了 96. 0%、94. 6%、88. 1%。 结论 改进算法结构简单,参数量较少,满足人脸目标实时检测的要求,适合部署在车载系统等资源有限的环境中,有效 保障驾驶员的驾驶安全。

  • 基于改进 YOLOv7 的漂浮垃圾目标检测

    周孟然a , 范桃春b , 王 宁b , 蔡 睿b

    2025, DOI:

    Abstract:

    目的 针对复杂的内河河道环境,漂浮垃圾中小目标物体占大多数且易受来自水面和岸边环境反光等因素 影响,造成目标外形模糊,易被遮挡,给目标检测带来困难;提出了一种基于改进 YOLOv7 的河道漂浮垃圾检测算 法。 方法 首先,针对河道漂浮垃圾的受环境影响外形发生变化,通过改进 SPPCSPC 模块,增强对小目标物体的特 征提取能力;其次,加入中心化特征金字塔,通过 ROI( region of interest) 与特征金字塔进行加权融合,方便对于不同 尺度目标的检测。 最后,由于针对传统 IoU( intersection over union) 对于小目标物体位置偏差非常敏感,降低了检 测性能。 采用了 Wasserstein Distance 来替代 IoU 作为检测衡量指标,通过引入基于 NWD( Normalized Wasserstein Distance) 的损失函数,从而提高检测精度。 结果 实验结果表明:改进 YOLOv7 算法模型准确率增加 3. 1% 达到 89. 7%,并在 IoU 为 0. 5 以及 IoU 在 0. 5 ~ 0. 95 情况下,平均均值精度分别增加了 6%、4. 6%,分别达到 87. 8%、 43. 4%,检测结果优于其他经典检测模型。 结论 通过实验结果可以看出,改进后模型在检测精度上有显著提升,对 于实际应用具有一定的参考价值。

  • 基于操纵痕迹融合的人脸伪造检测方法

    黄继胜, 杨高明

    2025, DOI:

    Abstract:

    目的 针对目前缺乏一种能够在复杂场景中暴露假脸图像的强大的假人脸检测模型,提出了一种新的网络, 称为双流操纵痕迹网络( Two-stream Manipulation Trace Network, TSMTN) ,用于学习假图像面部区域上的细微操纵 痕迹。 方法 该方法不同以往直接从图像中学习特征,而是先从图像中提取操纵痕迹,之后通过操纵痕迹检测人脸 是否被操纵。 该网络由于 3 个关键模块组成:空间域操纵痕迹提取( Spatial Domain Manipulation Trace Extraction, SDMTE) 、频域操纵痕迹提取( Frequency Domain Manipulation Trace Extraction, FDMTE) 以及基于自注意力机制的 特征融合模块( Feature Fusion Module, FFM) 。 SDMTE 使用卷积神经网络( CNNs) 来学习图像空间域中的细微操纵 痕迹。 FDMTE 学习图像频域中高频信息的操纵痕迹。 FFM 融合空间域和频域中的操纵痕迹,以生成用于分类的 最终特征。 结果 实验结果表明:该模型具有良好的性能,在常用检测数据集上到达了先进的水平。 结论 该方法表 现出较好的鲁棒性和泛化能力,取得了一些进步,具有重要意义。

  • 基于对抗训练的改进人脸伪造检测方法

    张 凯1 , 范智贤2

    2025, DOI:

    Abstract:

    目的 针对现有人脸伪造检测方法泛化性不足、鲁棒性较差的问题,提出了一种基于对抗训练的改进人脸伪 造检测方法( ATNet) 。 方法 ATNet 通过动态合成对抗伪造样本扩大样本空间,强化模型对不同伪造算法生成的伪 造样本“ 敏感度” ,避免训练样本过采样导致的模型过拟合问题;替换特定地标点标识的伪造区域以提高模型学习 不同伪造特征的能力;采用高频噪声和低频纹理并行学习策略,融合多层次卷积特征,促使模型捕捉更具综合性的 伪造线索,使其更有效的鉴别伪造图像。 结果 随着有效的对抗样本生成,ATNet 可以学习到更为本质的伪造特征, 相对于当前较为优秀方法如 Xception,F3Net,Face X-ray 等在检测精度和泛化性上均有不同程度地提升,跨数据集 测试结果表明该模型具备优秀的泛化性能;使用降维算法进行可视化可以直观判断出 ATNet 对于深度伪造图像的 检测能力。 结论 基于改进对抗训练的人脸检测方法可以有效提升检测精度和泛化性,强化模型对于多种伪造特征 的“ 敏感度” ,在多个数据集上的实验结果表明 ATNet 是简单有效的。

  • 基于人工与 ChatGPT 标注的推文情感分析对比研究

    杨 艺1 , 黄镜月1 , 贺品尧1 , 荣 婷2

    2025, DOI:

    Abstract:

    目的 针对特定推文情感分析任务中标注数据的困难和由于标注不准确带来的分类结果不尽如人意问题,提出 一种机器标注数据的方法来研究深度学习模型对人工标注和机器标注推文数据情感分类的性能表现差异。 方法 研 究中,对于统一的标签体系,分别对推文数据进行人工标注和运用 ChatGPT 模型接口标注,再采用 BERT-TextCNN 深 度学习混合模型,对经过人工标注和 ChatGPT 标注的数据集进行情感分类。 结果 实验结果表明:人工标注数据集在 整体性能上表现出更高的准确性和可信度,但是在某些推文数据上, ChatGPT 大模型以其比人更丰富的知识储备,可 以生成比人更客观科学的可解释性标注,在情感分类结果上呈现出一定的优势,人工标注和机器标注方法各具优劣; 由此可以得出对于文本情感分类任务,机器标注是一种可行的标注方法。 结论 在实际应用场景中,可以根据任务需 求灵活选择和结合两种标注方法,充分利用两者之间的优势,以达到更佳的分析性能和效果。

  • 嵌入注意力机制和通道重排的人脸表情识别研究

    汪正权, 朱成杰

    2025, DOI:

    Abstract:

    目的 针对传统卷积神经网络在人脸表情识别过程中存在网络结构复杂、特征提取弱化更能反映情感状态 的眼睛和嘴唇区域而造成的针对性不强、忽略了人脸表情中空间结构信息导致识别准确度不高等问题,在主流人 脸表情识别方法的基础上提出了一种嵌入注意力机制和通道重排的人脸表情识别方法。 方法 首先,将预处理的人 脸图片传入空间注意力模块,通过增强空间维度信息,使得模型能够更好地关注图像中的关键区域;然后对获取到 的空间注意力特征图的通道进行切分,使信息流通过不同的路径,再进行通道融合,从而增强了特征表达能力;其 次,将得到的特征图传入到通道注意力模块,增强通道维度信息;最后,通过全局平均池化来进行网络预测。 结果 所设计的网络仅以 1. 9 M 的参数量在数据集 FER2013 和 CK+上分别达到 71. 80%和 99. 66%的识别准确度。 结论 该方法相比许多传统经典算法有更好的识别效果,为提高人脸表情识别准确度提供了一种更有效的途径,具有很 好的实用价值和应用前景。

  • 基于时空一致性的视频篡改检测方法

    程 健1 , 杨高明2 , 杨新露2

    2025, DOI:

    Abstract:

    目的 随着视频篡改技术的快速发展,原始视频与篡改视频之间的差距愈发缩小,现有检测方法在处理篡改 视频数据时,仍需提高检测准确度以及泛化性能,为此,提出一种基于时空一致性的视频篡改检测方法。 方法 首先 通过不同的视频采样步幅预处理视频数据,利用时序卷积核在高采样率视频帧数据中侧重提取帧间时序特征信 息,空间卷积核在低采样率视频数据中侧重提取帧内空间特征信息,并在高采样视频帧数据与低采样视频帧数据 间建立横向连接,从而获得更有效的视频时空特征;同时结合 Transformer 模型在时空特征序列中提取时空特征的 不一致性,实现对篡改视频的判定。 结果 改进的方法在高质量和低质量 FaceForensics++数据集上进行性能测试, AUC 数值分别达到 99. 47%和 93. 05%,此外在 FaceForensics++数据集上的域内跨伪造方式实验以及 Celeb-DF 数 据集上的跨数据集实验中,测试结果相较于目前主流检测算法同样表现出竞争性,消融实验结果验证了方法中每 个单一模块的有效性。 结论 各项实验结果验证,所提方法在域内性能测试中有着优于现有算法的检测精度,并且 在跨域性能测试中具有更好的泛化性能,即验证了联合时空卷积 Transformer 模型可以提高模型泛化性能。

  • 一种结合上下文感知模块的高压微雾灰尘检测方法

    陈 洋1 , 张晓光1, 3, 4 , 陆凡凡2 , 束正华2 , 徐文强5 , 王 涵2 , 徐新志2

    2025, DOI:

    Abstract:

    目的 针对堆场下料口灰尘大,喷雾系统无法快速精准定位除尘等问题,提出一种结合上下文感知模块的检 测方法以实现对现场粉尘的有效检测,辅助高压喷雾系统快速除尘。 方法 首先模型的主干网络为轻量级网络 EfficientNetB0,在实现高效特征提取的同时可以大大减少网络的模型参数量,提升部署阶段应用效率;其次利用 CoT( Contextual Transformer) 模块充分探索相邻层级之间的上下文信息,以一种结合静态与动态信息的方式提升自 注意力学习,增强网络特征提取能力,进而提升输出特征的表达能力;最后在 3 个输出层之间进行通道调整与融合 之后输入自适应空间特征融合( Adaptively Spatial Feature Fusion,ASFF) 网络,进一步融合各通道之间的信息特征, 有助于特征细节信息的学习。 结果 整个网络的模型大小为 20. 42 MB,有利于模型的嵌入使用,均值平均精度 ( mean Average Precision,mAP) 为 95. 98%。 结论 提出的结合上下文感知模块的检测方法应用于堆场下料口灰尘 检测不仅降低了计算量且在精确度方面有一定优势,满足检测要求。

  • 基于长期视觉特征的阿尔茨海默症检测方法

    黄 猛

    2025, DOI:

    Abstract:

    阿尔茨海默症( Alzheimer’ s Disease,AD) 缺乏有效治疗方法,给患者和社会带来了巨大的危害,为弥补 现有方法的不足,提出一种利用长期视觉特征检测阿尔茨海默症的创新方法。 方法 首先从个体在日常环境中行走 的视频中提取 17 个人体关键点坐标,涵盖手掌、手臂、肩膀、脚踝、膝盖、胯、躯干和头部等关键区域。 这些关键点 数据被组合成一个带有长期视觉特征的数据集,通过这样的数据集输入到序列神经网络进行训练。 结果 实验结果 显示:该方法在阿尔茨海默症检测中表现出色,最终的检测正确率达到 0. 96,F1 值为 0. 93,证明该方法在性能上具 有卓越的表现,进一步强调了长期视觉特征在阿尔茨海默症检测中的重要性。 结论 该方法为阿尔茨海默症的检测 提供了一种有效的途径,弥补了目前治疗方案的空白;同时,实验结果凸显了时序处理网络在该任务中的显著作用;未 来的研究需要更深入地探讨和优化时序处理网络的结构和功能,以进一步提高阿尔茨海默症检测的精确性和可靠性; 这一创新性方法为未来疾病早期诊断和治疗提供了新的方向,为相关领域的研究和应用带来了希望。

快速检索
检索项
检索词
卷期检索
过刊浏览
×
2024年《重庆工商大学学报(自然科学版)》影响因子显著提升