复旦博士生使用ocr和正则表达式上人民日报公众号,这有何意义?
的有关信息介绍如下:复旦博士生使用ocr和正则表达式上人民日报公众号,这有何意义?下面就我们来针对这个问题进行一番探讨,希望这些内容能够帮到有需要的朋友们。

复旦大学官方微博出文,自3月初至今,院校运行常态核酸筛选工作中,规定班集体高校辅导员务必核查学员“健康云”核酸进行截图,保证“不漏一人”。
院校信息科学合理与工程学校博士研究生李小康的实际操作爆火,数分钟就能迅速核查百余人的核酸进行截图,进一步提高核查高效率和精密度!
据统计,李小康现阶段出任学校2019级信息1班高校辅导员。针对核查核酸汇报的工作中,他表明:“听起来仿佛非常简单,但实际上做的情况下,一个班集体的截图很有可能就要花上半小时核查,如果是总数多的系院很有可能要更久,还有可能会弄错看漏。”
做为生物医学工程技术专业博士研究生,他的研究课题是影像诊断与人工智能技术,平时会触碰许多图象处理方式。李小康第一时间想起之前学得过的OCR(OpticalCharacterRecognition,电子光学图像识别)技术性。
“OCR可以把图片中的图片文字识别出去,变换为文字信息,就便捷用于核查了。并且由于核酸截图是打印出字体样式,准确率十分高,几乎可以保证100%精确。”

他还想起了Python语言表达中的正则——可以检索到字符串数组中的特殊方式内容。“应用正则就可以把要想的信息从OCR鉴别的文字中选择出去。最终,确定好每份截图里的名字、现场采样和是不是已取样等信息后,再把每个人的结果输出到Excel文档中,便捷人力确定。”
最终,李小康明确了“OCR识别文字+正则挑选”的程序构思。3月15日晚,他花了一个多钟头就写下了原始编码,共130行,发觉的确可以跑通,且运作高效率很高。
程序一写好,李小康就在自身班里的核酸截图数据信息上开展认证,准确度果真很高,乃至检验出了以前人力核查没有察觉的问题。而且,程序运作时间很短,80好几张图只必须20多秒。
现阶段,程序已在该学校服务项目两个星期。李小康曾让其他教师使用自身的程序开展核查。800幅截图,原先要几个人核查一个多钟头,如今只需等2分钟就取得结果。
他把这个事故发生到微信朋友圈以后,许多朋友表明特别感兴趣,他还把编码共享了出来。为了更好地便捷不容易编写程序的教师应用,李小康最终还把程序开展了封装形式——用的情况下,只需在命令键入一行编码就可以运作。

据统计,学校信息办也与李小康开展了连接。预估在一段时间的未来,老师学生们就可无需再手动式搜集核酸截图,反而是根据小程序立即上传照片,就可在后台管理随时随地查询统计分析结果。
4月7日中午,新闻记者与李小康建立联系时,他已经院校楼幢出任青年志愿者送餐。
他说道过:“基本原理也非常简单,只需是会敲代码的人第一时间便会搞清楚是什么原因,可是不做有关作业的体会不上这件事的耗时费力,当然也不会想到方法。我只是我用学得的基础知识处理具体工作的艰难。”



