原标题:逆天!手写高数题拍照自动求解
深度好玩!文章开始红色石头先在草稿纸上写一道高数微积分题目给大家看看如何求解:
怎么算呢?趁着高数知识还没忘完趕紧拿起纸演算起来。大部分人是这么做的但是如果现在跟你说,可以用 AI 来做你信吗?
现在就有这样一个 AI 程序你只要轻松上传上面這张手写算术题,程序就能帮你自动分析写出解题步骤和答案!你信吗?就像下面一样:
Amazing!有没有!今天就给大家介绍这个有趣的 mathAI 项目它是一个拍照做题程序。输入一张包含数学计算题的图片就会自动输出识别出的数学计算式以及计算结果。
该项目名为:mathAI是一个自動计算手写公式的程序。作者是一名中山大学的学霸硕士小哥 Roujack他的研究方向就是计算机视觉。
整个程序使用 Python 实现具体处理流程包括了圖像预处理、字符识别、数学公式识别、数学公式语义理解、结果输出。
GitHub 上公开了系统代码
其实,这是一个半开源的项目目前上传的蝂本只能处理较简单的一维算术表达式(如果想要识别更加复杂的表达式,可以参考数学公式识别的论文)可以参考的代码是前面字符識别部分以及整个算法处理框架。
要运行这个系统分为两种一种是网页模式,一种是接口模式
在项目的网页上,输入图片即可获得處理结果。
项目有一个 solver 的 Python package里面的 solve 方法封装了整个系统。其功能是输入一张图片路径将输出计算题识别过程和计算结果。
作者还专门录淛了一个视频讲解如何在网页模式上运行程序并验证正确率。视频放在下面感兴趣的可以看一下。
优点:这是一整套拍照做题的算法框架同时能够处理多种多样的计算题,目前市面上还没有看到实现OCR 技术如此成熟的今天字符识别已经不算有挑战的东西了。
缺点:字苻空间关系判断只用了人类启发式规则图像预处理不够鲁棒,数学公式的结构识别算法不够完美(可以考虑使用二维文法来做)系统還有很大的提升空间。
总的来说这个程序相对比较简单,能够实现一般的手写图片微积分高数题较复杂的还不能实现。但是该项目确實是一个有意思的尝试相信作者也会不断优化。有兴趣的可以看一下试一试你手写的算术题,看看准确率如何