• 简体   /   繁体
融入强依赖序列的图像字幕生成-物联网技术2026年05期

融入强依赖序列的图像字幕生成

作者:杨世平 车进 曹昊男 字体:      

0引言

图像描述作为计算机视觉与自然语言处理的交叉学科,属于多模态任务的前沿研究方向[。它首先利用计算机视觉提取图像特征,然后通过自然语言处理技术生成描述文本。而生成图像的描述文本是一项充满挑战的任务,主(试读)...

物联网技术

2026年第05期