1.组名
潇洒不是摆烂
2.组员
黄笑然 陈佳瑶 苏国培 刘玉婷 安游珺
3.项目名
基于模板匹配的票证识别平台
4.项目介绍
我们的项目是基于模板匹配的票证识别平台。随着人工智能技术的发展,OCR技术有了重大突破,票证管理也逐渐朝着数字化的方向发展。本票证识别平台采用OCR识别技术,结合预置模板,实现自动识别票证类别,并保证识别结果以统一格式进行结构化输出,解决了票证存储难、录入难、管理难、效率低的问题,为数据的进一步智能管理及其分析,打下了坚实的基础。同时本平台支持任意固定版式卡证、票据的模板制作,用户可以通过自定义模板来获取想要的结构化内容,应用场景十分广泛,可以应用于财务票据,医疗票据,卡证等,进行票证分类、关键内容提取、信息统计分析等等,智能识别为结构化的文本,有效降低人工录入成本,提升信息管理效率。
5.设计过程
我们的项目表分为用户和模板两大部分,将用户存在一个表中,用户管理记录存在一个表中;将模板存在一个表中,模板有关的字段分别存储三个表种,模板管理也有单独的一个表,实现了模块的分离。
设计最初,我们认为应该对每一个模板都建一张表,来存储表中具体的固定字段和参考字段,但是在具体讨论之后,发现这是一个不实际的想法,一个是会带来很大的工作量,再一个是检索时很不方便,于是我们更换了思路,将所有模板储存在一个模板表中,将所有模板的固定字段存储在一个表中,再将所有模板的参考字段存储在一个表中。这样设计后,表的数量大大减少,功能也明确了很多,检索效率也可以大大提升。
用户方面的表格设计也经过了很多讨论。一开始我们认为没有必要创建一个角色表来存放所有角色,而是只将角色名作为用户表的一个属性,但是再经过商量,还是认为要将各模块的耦合程度降低,于是新建了一个角色表,也更加方便之后平台的权限管理。
6.E-R图
全局
7.逻辑结构设计
序号 | 表名 | 功能说明 |
1 | user | 用户表 |
2 | role_power | 角色表 |
3 | template | 模板表 |
4 | fixed_field | 固定字段表 |
5 | reference_field | 参考字段表 |
6 | identify_area | 识别区表 |
7 | login | 登录日志表 |
8 | preset_template_upload | 预置模板上传记录表 |
9 | user_manage | 用户管理表 |
10 | template_use | 用户使用模板记录表 |
11 | template_manage | 模板管理表 |
8.设计心得
- 数据库设计要解决的第一个问题就是数据库设计人员如何全面、准确的获取业务需求,于是本组同学对照用例文档再次认真进行了分析,最终确定了表的结构和属性。
- 我们首先确定了一个单位需要有哪些数据项,再确定了哪些字段构成一个表,最后确定表之间有什么关系。之后我们使用实体-联系建模方法绘制了E-R图,使业务需求更加精准和消除二义性。
- 我们接受了一定的数据冗余来保证之后的运行性能,牺牲了空间但是节省了时间,比如将参考字段和识别区分开储存。
- 和组员们的讨论过程让我们理解到沟通的重要性,互相之间认真的分析交流可以理清思路,以便设计出更加合理的数据库。
- 数据库的设计完成离不开老师和学姐的指导,让我们明白了做项目要和老师多沟通交流,及时弄懂不清晰的地方。