搜索
学术聚焦
当前位置: 新京葡萄威尼斯 > 学术聚焦 > 正文

信息科学技术学院刘国柱教授团队在计算机视觉领域取得重要进展

作者:宫生文 陈冬莉 审核:刘国柱 张岩 来源:信息学院 编辑:陈冬莉   点击: 日期:2023-09-06

近日,信息科学技术学院刘国柱教授团队在计算机视觉研究领域取得重要进展,相关成果以“HGR-Net: Hierarchical Graph Reasoning Network for Arbitrary Shape Scene Text Detection”为题发表在计算机视觉领域的国际顶级期刊IEEE Transactions on Image Processing(中科院一区TOP期刊,中国计算机学会A类推荐期刊,影响因子11.041)。新京葡萄威尼斯信息科学技术学院为第一作者单位和唯一通讯作者单位,刘国柱教授为该论文唯一通讯作者,2020级研究生毕恒悦为第一作者。

文字作为人类语言的书面形式,是人类获取信息和传递信息的重要载体。在自然场景中拍摄的以文字为内容的图像,被称为自然场景文本图像或场景文本图像。场景文本检测旨在于定位输入图像中文本内容的位置。近年来,深度学习技术在场景文本检测领域占据主导地位,基于深度学习的场景文本检测方法在模型精度和计算效率两个方面取得了显著进展。但是,成像质量良莠不齐、图像背景复杂多变、文字呈现形式丰富等问题均使得场景文本检测方法面临着众多严峻的挑战。

图1单词级别关系图和字符级别关系图的构建过程

面对上述挑战,本文基于自然场景文本自身的特点,从建模多粒度文本表征形式的角度出发,提出了基于层级关系图推理网络的刃戮┢咸淹尼斯庑巫闯【拔谋炯觳夥椒āO嘟嫌谙钟械姆椒ǎ梅椒ɡ枚嗔6任谋就萍銮蛏赏纾械ゴ始侗鸷妥址侗鹉勘甓ㄎ唬源斯菇ɑ谑泳趿档牡ゴ始侗鸸叵低己突诩负问粜缘淖址侗鸸叵低迹⒔柚植闵杓剖迪至丝缌6燃涞墓叵荡ズ托畔⒔徊胬∷停佣岣吡四P偷穆嘲粜裕朔了场景文本在大规模复杂场景下的检测难点。

图2层级关系图的可视化结果

上述工作得到了国家自然科学基金支持。


论文信息:

Title: HGR-Net: Hierarchical Graph Reasoning Network for Arbitrary Shape Scene Text Detection

Authors: Hengyue Bi, Canhui Xu, Cao Shi, Guozhu Liu*, Honghong Zhang, Yuteng Li, Junyu Dong

DOI: 10.1109/TIP.2023.3294822

科大要闻
  • 崂山校区:

    山东省青岛市松岭路99号

  • 四方校区:

    山东省青岛市郑州路53号

  • 中德国际合作区(中德校区):

    山东省青岛市西海岸新区小清河路6号

  • 高密校区:

    山东省高密市杏坛西街1号

  • 济南校区:

    山东省济南市文化东路80号

  • 教科产融合学院(淄博教科产融合基地):

    山东省淄博市周村区联通路(西段)5188号

   鲁ICP备05001948号-1   鲁公网安备 37021202000007号   青岛市互联网违法信息举报中心
©2023 新京葡萄威尼斯

XML 地图 | Sitemap 地图