学科专业

科学研究

您所在位置: 首页 > 学科专业 > 科学研究

中国科学技术大学谢洪涛教授与复旦大学陈智能副研究员来我院作学术报告

8月29日上午,中国科学技术大学谢洪涛教授与复旦大学陈智能研究员邀莅临我院分别作题为《篡改文本图像的生成与检测》和《场景文本识别:从视觉识别到视觉-语言交互》的学术报告。报告会于逸夫楼210会议室举行,我院副院长曹步清、张世文出席,部分教师、研究生到场聆听报告。报告会分别由曹步清和张世文主持。

▲谢洪涛教授作学术报告

▲陈智能研究员作学术报告

会议伊始,谢洪涛教授就报告背景进行说明。他指出近些年来,由于深度学习篡改算法生成的文本图像在互联网上广泛传播,对众多行业领域产生了重要影响,因而对于篡改文本图像的生成与检测就显得尤为重要。谢洪涛教授从篡改文本图像的“生成”与“检测”两个方面进行论述,通过探索篡改文本的生成网络结构、篡改文本检测的频域信息联合优化等方向,实现相关研究。同时,谢洪涛教授分别介绍了一种可以在真实场景文本图像上训练的生成算法和基于并行空域与频域特征感知的篡改文本检测算法。

在随后陈智能研究员的报告中,他指出,场景文本识别一直是计算机视觉领域的重要研究问题,广泛应用于图像搜索、自动驾驶等诸多任务中,旨在识别自然场景中拍摄的图像文本,将其中的文字区域转化为计算机可读取和编辑的符号。在深度学习时代,传统的文字识别已经无法适用不规则文字、残缺文字等环境,因而场景文本识别方法应从单纯利用字符级视觉特征,到利用文本行视觉特征,再到视觉和语言联合建模逐渐更新迭代。

▲师生聆听报告

▲提问交流

报告结束后,谢洪涛教授和陈智能研究员与在座师生进行了深入交流,对相关问题逐一进行解答,现场学术气氛浓厚。此次报告会加深了与会师生对篡改文本图像生成与检测、以及场景文本识别的理解,提升了大家对当前图像处理及识别等相关研究热点领域的最新认识。

文/黄俊杰图/颜杉羽