AI识别古彝文，“理科生”助力文化传承

古彝文的背景

古彝文识别面临的困难

AI识别古彝文

总结

⭐️古彝文的背景

彝文指的是云南、贵州、四川等地的彝族人使用的文字，其造字、使用方法在不同的区域之间表现出明显的差异。1980年发布的四川规范彝文有819字，2012年发布的滇川黔桂通用彝文有5598字。这两种彝文主要用于现代语境，在仪式、节庆、旅游景点等场合彰显彝族非物质文化遗产的传承，或用于民族地区相关政策和宣传文件的翻译，以及当代母语作家文学的创作。

世界级民族文化遗产——盘州古彝文

受高温潮湿环境等因素的影响，古彝文典籍的保存十分不易，勤劳智慧的彝族人民创造出“封底裹卷装”等方式来保存古籍。其具体装订方法：用一块幅面长度、宽度都超于纸张的皮革或布料作封底，将印写好的书叶以数叶为一叠放置在封底上，对齐边沿，在余幅处打眼用线装订，在封底末端中间订上一根细绳，不用时将书倒卷，以绳束紧，成卷存放。民间流传的手抄本外，目前大部分彝文古籍系属清代和民国，少量纸质、骨刻、石刻、木刻文献和一些金属器物铭文可上溯到更早时期。

⭐️古彝文识别面临的困难

传统的古彝文翻译面临着很多困难，如原籍难获取、古籍有残缺、翻译过程繁琐，甚至一本翻译需要十年起步。

⭐️原籍难获

首先要获取古彝文原籍，而这些原籍并不容易获得。研究者要向持有经书的布摩（彝族祭司）购买某本祖传书籍，一般来说他们是不愿意的，布摩以卖书为耻辱，有的人在入葬时要求与自己的经书一同火化。有时在政府专员的反复动员和劝说下，布摩会愿意转让部分典籍，也有一些致力于推广传统文化、已消除禁忌理念的人士愿意转让经书，这才使我们的研究得以可能。因此，彝文研究者必须长期驻扎当地，协助当地机构的各项工作，与古彝文传承人建立良好的关系，方能取得对方的信任与支持。

⭐️古籍残缺

拿到古籍后，页面如有残缺、粘滞，需要小心翼翼地分开，然后分页粘贴至更大幅的纸张上，以便翻检查阅，一些因年代久远出现脆化的纸片还需重新拼接，如图所示

《古彝文白马经书(公书)》全文

⭐️古籍翻译

接下来要对这些古籍进行断句和翻译。为了保护古籍，翻译家依照复印件来完成日常的翻译工作。如果彝语是译者的母语，他就可以自己将语句分开，加上国际音标；母语不是彝语的译者还需要在母语者的帮助下记音，再用汉语逐字直译，最后用流畅的汉语对整句话进行意译，这种方法称之为“四行法”，是丁文江和罗文笔翻译《爨文丛刻》时开创的。

目前，彝文字还没有被数字化，还没有预留的Unicode编码区段，所以在印刷出版时需要由一位彝文缮写员先将彝文字和国际编码抄写在书页的左侧，再将已输入电脑的汉文译文打印、剪切后粘贴在相应彝文字的右侧，形成我们最终看到的四行体彝汉文对译。