- 装帧:平装
- ISBN:9787121475313
- 出版日期:2024-07
- 书名:视觉问答理论与实践
- 出版社:电子工业出版社
- 作者:吴琦[等]著
- 开本:24cm
本书共5部分,第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术;第2部分将图像视觉问答进一步分为五类,即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络;第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务,包括具身视觉问答、医学视觉问答、基于文本的视觉问答等;第5部分对该领域进行总结和展望,讨论视觉问答领域的未来研究方向。