资源汇总 [持续更新]
「数字藏文」相关项目与资源索引。
网站
- Lotsawahouse:藏传佛教文献译丛:大量藏文文献及英、中、法、德等译文,体裁丰富。
- BUDA:佛教数字档案(佛教数字资源中心):合作平台,扩展佛教文献获取;可检索 BDRC 及合作伙伴提供的数百万页文本。
- 维也纳大学:甘珠尔与丹珠尔研究资源:电子文本与 PDF,侧重甘珠尔、丹珠尔,支持检索与 URL API。
- Github Esukhia:工具(语音、拼写、Python)、语料库与平行语料。
- Github Tibetan NLP:藏文 NLP 项目与语料元列表。
开发:藏文工具与软件
- pyewts:威利-EWTS 与 ACIP 转换的 Python 库。
- Python Tibetan Legacy Encodings
- botok:Esukhia 藏文分词(Python)。
- pybo:Esukhia 藏文分词(Python)。
开放工具与数据仓库
语料库
藏文语料
- 2013 UVA-SOAS eKangyur:Esukhia-Barom 甘珠尔校对项目;旧版见 derge-kangyur。
- Digital Derge Tengyur:Esukhia 与 Barom Theksum Choling 的德格版丹珠尔数字版。
- Esukhia 藏文语料合集
- Esukhia Nalanda 文本列表
- 元列表:Awesome tibetan canon
平行语料
- 结构化:84000 / Esukhia 藏英平行语料
- 非结构化:Lotsawahouse
数据库与维基
词典
- sympound-python
- Tibetisches Wörterbuch:首部学术藏德词典(进行中)