Skip to content

公式识别项目,基于tensorflow2.x开发,decoder使用transformer。结构简单,易于学习

License

Notifications You must be signed in to change notification settings

lsr12345/image2latex-transformer-tensorflow2.x

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

image2latex_transformer_tensorflow2.x

简介

基于tensorflow2.x开发的公式识别项目,encoder使用MASTER中实现的GCBlock,decoder使用transformer-decoder。项目结构简单,易于学习相关技术。

细节

  • encoder抽取特征后嵌入2D位置编码
  • 为方便batch训练,将图片进行填充255的pad操作
  • 图片pad之后嵌入2D位置编码并进行一维拉伸后会产生有效位置编码被割裂的问题,通过将图片进行270度旋转解决此问题
  • 数据增强使用模糊、噪声、压缩

Requirements

  • tensorflow2.x
  • opencv
  • imgaug
  • numpy

训练

Demo

About

公式识别项目,基于tensorflow2.x开发,decoder使用transformer。结构简单,易于学习

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages