བོད་ཡིག་ཚིག་མཛོད་གཞི་རྩའི་གསལ་བསྒྲགས།|藏文词典数据库完整报告

ལས་འཆར་གཞི་རིམ་གནས་ཚུལ། |项目基本信息

བོད་ཡིག / 藏文 རྒྱ་ཡིག / 中文 གནད་དོན། / 信息
ལས་འཆར་མིང་། 项目名称 བོད་ཡིག་ཚིག་མཛོད་གཞི་རྩའི་ཕྱོགས་བསྡུས། (藏文词典数据库集成 / Tibetan Dictionary Database Collection)
པར་གཞི། 版本号 v1.0
བཟོ་འཛུགས་ཚེས་གྲངས། 创建日期 2026年01月30日 / 2026ལོ་1ཟླ་30ཉིན།
མཇུག་བསྡུའི་དུས་ཚོད། 最后更新 2026年01月30日 / 2026ལོ་1ཟླ་30ཉིན།
ཀོད་གཟུགས། 编码格式 UTF-8(གཙོ་བོ། / 主要)
སྐད་རིགས། 语言 བོད་ཡིག རྒྱ་ཡིག དབྱིན་ཡིག ལེགས་སྦྱར། འབྲུག་ཡིག་སོགས། / 藏文、中文、英文、梵文、宗喀语等
གཞི་རྩའི་རྣམ་པ། 数据格式 TXT、CSV、XLSX、XLS、DOCX、DOC
ཡིག་ཆ་ཁྱོན། 文件总数 149 གྲངས། / 个
ཚིག་ཁྱོན། 总词条数(估算) 10,348,236+ ཚིག / 条
གཞི་རྩའི་ཁྱོན། 总数据量 911.5 MB
ཆ་སྙོམས་ཡིག་ཆའི་ཚད། 平均文件大小 6.1 MB

དཀར་ཆག / 目录

  1. ལས་འཆར་མདོར་བསྡུས། / 项目概述
  2. གཞི་རྩའི་ཁུངས། / 数据来源
  3. ཡིག་ཆའི་བཀོད་པ། / 文件结构
  4. རྣམ་གཞག་ཚད་ལྡན། / 格式规范
  5. ཚིག་མཛོད་རྒྱས་བཤད། / 词典详细信息
  6. གཞི་རྩའི་ཁྱད་ཆོས། / 数据统计
  7. བསྡུར་ཞིབ། / 质量控制
  8. བེད་སྤྱོད་གྲོས་འདེབས། / 使用指南
  9. འཕྲུལ་རིག་ཚད་ལྡན། / 技术规范
  10. པར་དབང་དང་གན་དབང་། / 版权与许可
  11. གསར་བཅོས་ལོ་རྒྱུས། / 更新历史
  12. བཀའ་དྲིན་རྗེས་དྲན། / 致谢

ལས་འཆར་མདོར་བསྡུས། / 项目概述

ངོ་སྤྲོད། / 简介

བོད་ཡིག་ཚིག་མཛོད་གཞི་རྩའི་ཕྱོགས་བསྡུས་འདི་ནི་ད་ལྟའི་བར་དུ་ཚད་ཆེ་ཤོས་ཤིག་ཡིན། ཁུངས་དང་རིགས། ཁྱབ་ཁོངས་མི་འདྲ་བའི་བོད་ཡིག་ཚིག་མཛོད་ཡིག་ཆ་149བསྡུས་ཡོད། གཞི་རྩའི་ཁྱོན་911.5 MBདང་། ཚིག་10,348,236+ལས་མང་བ། ནང་བསྟན་དཔེ་ཆ། སྤྱི་ཡོངས་ཚིག་མཛོད། ཆེད་ལས་ཁྱབ་ཁོངས། ཁ་སྐད། རྒྱུད་དཔེ་ཚིག་མཛོད། ཆེད་གཅོད་ལག་ཆ་སོགས་རིགས་7ཁྱབ་ཡོད།
本数据库是迄今为止最全面的藏文词典数据集合之一,汇集了149个不同来源、不同类型、不同领域的藏文词典文件。数据库总规模达到911.5 MB,包含超过10,348,236+个词条,涵盖佛教文献、综合词典、专业领域、方言口语、古籍词汇、专项工具等7大类别。

གཙོ་བོའི་ཁྱད་ཆོས། / 主要特点

བེད་སྤྱོད་གནས་ཚུལ། / 应用场景

  1. ཚིག་མཛོད་ཉེར་སྤྱོད། / 词典应用开发
    • འགུལ་ཆས་བོད་ཡིག་ཚིག་མཛོད་App གསར་སྐྲུན། / 移动端藏文词典App开发
    • ཀླད་ཀོར་ཚིག་མཛོད་མཉེན་ཆས། / 桌面端词典软件
    • དྲ་བའི་ཚིག་མཛོད་དྲ་ཚིགས། / 在线藏文词典网站
    • ལྟ་ཆས་ཁ་སྣོན། / 浏览器扩展和插件
  2. འཕྲུལ་ཆས་ཀྱིས་སྐད་སྒྱུར། / 机器翻译
    • བོད་རྒྱ། བོད་དབྱིན་སྐད་སྒྱུར་མ་ལག་སྦྱོང་བརྡར། / 藏中、藏英翻译系统训练
    • དབྱངས་འབྱོར་སྐད་སྒྱུར་ཚད་གཞི། / 神经机器翻译模型
    • ཐ་སྙད་མཛོད་གསར་འཛུགས། / 术语库构建
  3. སྐད་ཡིག་ཐོན་རང་། / 自然语言处理
    • བོད་ཡིག་ཚིག་དབྱེ་མ་ལག / 藏文分词系统
    • ཚིག་གི་རྣམ་གྲངས་བཏགས་པ། / 词性标注
    • མིང་བཏགས་ངོས་འཛིན། / 命名实体识别
    • དོན་ངོས་བརྟག་དཔྱད། / 语义分析
  4. སྐད་ཡིག་ཞིབ་འཇུག / 语言学研究
    • བོད་ཡིག་ཚིག་མཛོད་ཞིབ་འཇུག / 藏文词汇研究
    • ཁ་སྐད་བསྡུར་ཆོད་ཞིབ་འཇུག / 方言对比研究
    • ཐ་སྙད་ཚད་ལྡན་ཞིབ་འཇུག / 术语标准化研究
  5. ཤེས་ཡོན་སྦྱོང་བརྡར། / 教育培训
    • བོད་ཡིག་སློབ་སྦྱོང་ལག་ཆ་གསར་སྐྲུན། / 藏文学习工具开发
    • སློབ་ཁྲིད་རོགས་རམ་མ་ལག / 教学辅助系统
    • དྲ་བའི་སློབ་སྦྱོང་ལམ་ལུགས། / 在线学习平台
  6. རིག་གནས་སྲུང་སྐྱོབ། / 文化保护
    • བོད་ཡིག་དཔེ་ཆ་གྲངས་འབེལ། / 藏文文献数字化
    • སྲོལ་རྒྱུན་རིག་གནས་རྒྱུན་འཛིན། / 传统文化传承
    • སྐད་ཡིག་ཐོན་ཁུངས་སྲུང་སྐྱོབ། / 语言资源保护

གཞི་རྩའི་ཁུངས། / 数据来源

ཁུངས་ཀྱི་དབྱེ་བ། / 来源分类

ཡིག་ཆ་འདིར་ཚིག་མཛོད་ཡིག་ཆ་149ཡོད་པ་དེ་དག་ཁུངས་དང་རིགས་ངོས་ནས་རིགས་7དུ་དབྱེ།
本数据库包含149个词典文件,按来源和类型分为7大类:

༡། ནང་བསྟན་དཔེ་ཆའི་ཚིག་མཛོད། / 1. 佛教文献(18གྲངས། / 个)

བསྡུས་པ་18གྲངས། ཁྱོན་ཚད་46.8 MB།
共收录18个佛教文献词典,总大小46.8 MB。

ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对 རྣམ་གཞག / 格式
84000词汇表23.7.21.txt 16.3 MB 312,615 藏英 .txt
84000词库v1.2.txt 5.7 MB 76,242 藏英 .txt
གསང་སྔགས་ཚིག་མཛོད།-藏传密宗辞典.txt 5.5 MB 17,766 藏文 .txt
༨༤༠༠༠་-84000.txt 5.4 MB 30,435 藏英 .txt
汉藏对照佛学词典(生成).txt 3.4 MB 128,670 藏英 .txt
རྒྱ་བོད་ནང་བསྟན་ཚིག་མཛོད།-汉藏对照佛学词典.txt 1.6 MB 21,445 藏英 .txt
བོད་རྒྱ་ནང་བསྟན་ཚིག་མཛོད།-藏汉佛学词典.txt 1.0 MB 46,944 藏英 .txt
21-Mahavyutpatti-Skt_uni.txt 854.0 KB 9,586 藏梵 .txt
汉藏佛学词汇-原稿.docx 612.1 KB 145676 藏英 .docx
藏汉佛学词典.txt 545.7 KB 11,396 藏英 .txt

༢། སྤྱི་ཡོངས་བོད་ཡིག་ཚིག་མཛོད། / 2. 综合词典(11གྲངས། / 个)

བསྡུས་པ་11གྲངས། ཁྱོན་ཚད་160.0 MB།
共收录11个综合词典,总大小160.0 MB。

ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对 རྣམ་གཞག / 格式
བོད་ལེགས་སྦྱར་ཚིག་མཛོད་ཆེན་མོ།-藏梵大词典.txt 66.0 MB 240,423 藏梵 .txt
བོད་ཡིག་ཚིག་མཛོད་རྒྱ་མཚོ།-藏文辞海.txt 36.2 MB 229,902 藏文 .txt
བོད་དབྱིན་རྒྱས་བཤད་ཚིག་མཛོད།-藏英详解百科词典.txt 21.6 MB 90,426 藏文 .txt
བོད་རྒྱ་ཚིག་མཛོད་ཆེན་མོ།-藏汉大辞典.txt 20.2 MB 160,506 藏汉 .txt
དུང་དཀར།-Dungkar.txt 16.6 MB 13,281 藏文 .txt
དུང་དཀར་ཚིག་མཛོད་ཆེན་མོ།.txt 16.6 MB 13,384 藏文 .txt
དུང་དཀར་ཚིག་མཛོད།.csv 15.7 MB 13,296 藏文 .csv
ཚིག་མཛོད་ཆེན་མོ།.csv 12.1 MB 49,639 藏文 .csv
རིན་ཆེན་མགོན་པོའི་ཚིག་མཛོད།-仁青贡布辞海.txt 7.3 MB 364,854 藏文 .txt
རྒྱ་བོད་ཚིག་མཛོད་ཆེན་མོ།-汉藏大词典.xlsx 3.0 MB 54531 藏汉 .xlsx
དབང་རྩ་ཚན་རིག་གི་ཚིག་མཛོད་ཆེན་མོ།.csv 44.7 KB 617 藏文 .csv

༣། ཆེད་ལས་ཁྱབ་ཁོངས་ཀྱི་ཚིག་མཛོད། / 3. 专业词典(15གྲངས། / 个)

བསྡུས་པ་15གྲངས། ཁྱོན་ཚད་31.0 MB།
共收录15个专业词典,总大小31.0 MB。

ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对 རྣམ་གཞག / 格式
གསོ་རིག་ཚིག་མཛོད་བསྡུས།-简明藏医辞典.txt 6.5 MB 25,012 专业 .txt
汉藏术语汇编24.12.10.txt 4.2 MB 165,324 藏汉 .txt
地理词典(生成).txt 3.6 MB 151,158 专业 .txt
ཐ་སྙད་འགྲེལ་པ།-藏文术语解释.xlsx 3.0 MB 16530 专业 .xlsx
大气科学名词.doc 2.3 MB 7739 专业 .doc
རྒྱ་བོད་སྐྱེ་དངོས་ཚིག་མཛོད།-汉藏-藏汉对照生物学词典.txt 2.1 MB 102,918 藏汉 .txt
རྒྱ་བོད་ཐ་སྙད་བསྡུས།-汉藏术语汇编.txt 1.9 MB 27,554 藏汉 .txt
物理词典(生成).txt 1.7 MB 69,708 专业 .txt
ས་ཁམས་ཚིག་མཛོད།-地理词典.txt 1.6 MB 25,193 专业 .txt
汉藏-藏汉对照生物学词典.txt 945.3 KB 17,153 藏汉 .txt

༤། ཁ་སྐད་ཚིག་མཛོད། / 4. 方言口语(6གྲངས། / 个)

བསྡུས་པ་6གྲངས། ཁྱོན་ཚད་11.8 MB།
共收录6个方言口语词典,总大小11.8 MB。

ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对 རྣམ་གཞག / 格式
སྡེ་དགེའི་ཁ་སྐད་ཚིག་མཛོད།-德格方言词典.txt 5.7 MB 43,674 藏文 .txt
ལྷ་སའི་ཁ་སྐད་ཚིག་མཛོད།-拉萨口语词典.txt 2.3 MB 87,370 藏文 .txt
ཨ་མདོའི་ཁ་སྐད་ཚིག་མཛོད།-安多藏语口语词典.txt 1.3 MB 49,122 藏文 .txt
ལྷ་སའི་བྱ་ཚིག་ཚིག་མཛོད།-拉萨动词词典.txt 1.2 MB 3,333 藏文 .txt
拉萨地名汉藏对照(生成).txt 932.0 KB 18,358 藏汉 .txt
ལྷ་སའི་ས་མིང་།-拉萨地名汉藏对照.txt 448.1 KB 3,060 藏汉 .txt

༥། རྒྱུད་དཔེ་ཚིག་མཛོད། / 5. 古籍词汇(22གྲངས། / 个)

བསྡུས་པ་22གྲངས། ཁྱོན་ཚད་7.1 MB།
共收录22个古籍词汇词典,总大小7.1 MB。

ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对 རྣམ་གཞག / 格式
བོད་ཡིག་རྙིང་པའི་ཚིག་མཛོད།-古藏文辞典.txt 4.5 MB 20,892 藏文 .txt
བོད་ཡིག་རྙིང་པའི་ཚིག་མཛོད།-古藏文词典.txt 1.2 MB 30,135 藏文 .txt
古藏文词典(备份).txt 1.2 MB 30,135 藏文 .txt
དག་ཡིག་ནོར་མེད་ལམ་བཟང་།-正字无误妙道.txt 716.3 KB 12,063 藏文 .txt
格萨尔王传词汇注解22.4.25.txt 653.2 KB 12,039 其他 .txt
གེ་སར་སྒྲུང་གི་ཚིག་འགྲེལ།-格萨尔王传词汇注解.txt 629.7 KB 4,013 其他 .txt
西藏通史·清代卷.txt 189.8 KB 6,888 其他 .txt
西藏通史·吐蕃卷.txt 158.7 KB 7,938 其他 .txt
西藏通史·明代卷.txt 142.9 KB 5,880 其他 .txt
西藏通史·早期卷.txt 133.8 KB 6,834 其他 .txt

༦། ཆེད་གཅོད་ལག་ཆའི་ཚིག་མཛོད། / 6. 专项工具(9གྲངས། / 个)

བསྡུས་པ་9གྲངས། ཁྱོན་ཚད་9.5 MB།
共收录9个专项工具词典,总大小9.5 MB。

ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对 རྣམ་གཞག / 格式
བོད་རྒྱ་སྤྱིར་བཏང་གི་ཚིག་མཛོད།-藏汉对照常用合称词词典.txt 1.6 MB 6,375 藏汉 .txt
བོད་རྒྱ་ཟླ་སྒྲིལ་ཚིག་མཛོད།-藏汉对照合成词词典.csv 1.6 MB 2,123 藏汉 .csv
藏汉对照常用合称词词典24.2.29_processed.txt 1.6 MB 2,122 藏汉 .txt
མི་མིང་ས་མིང་ཚིག་མཛོད།-常见藏语人名地名词典.txt 1.4 MB 31,362 藏文 .txt
常见藏语人名地名词典(藏汉).txt 1.0 MB 62,718 藏汉 .txt
བྱ་ཚིག-藏语动词.txt 1.0 MB 8,076 其他 .txt
藏汉对照常用合称词词典.xlsx 561.5 KB 23493 藏汉 .xlsx
བྱ་ཚིག་དུས་རྣམ།-动词时态.txt 439.9 KB 2,859 其他 .txt
འབྲུག་བསྡུས་མིང་།-不丹缩写字典.txt 296.7 KB 18,469 其他 .txt

༧། ཚིག་མཛོད་གཞན། / 7. 其他(68གྲངས། / 个)

བསྡུས་པ་68གྲངས། ཁྱོན་ཚད་644.3 MB།
共收录68个其他类别词典,总大小644.3 MB。

ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对 རྣམ་གཞག / 格式
རིག་པ།-Rigpa.txt 66.4 MB 919,103 其他 .txt
Rangjung Yeshe Tibetan-English Dictionary of Buddhist Culture.txt 55.8 MB 539,704 藏英 .txt
རང་བྱུང་།-Rangjung.txt 51.9 MB 539,701 藏英 .txt
རང་བྱུང་ཡེ་ཤེས།-RangjungYeshe.txt 30.0 MB 828,937 藏英 .txt
རྣལ་འབྱོར་སྤྱོད་པའི་ས་ཚིག་བསྡུས།-瑜伽师地论词汇表.txt 27.9 MB 547,035 其他 .txt
བོད་དབྱིན་དེང་རབས་ཚིག་མཛོད།-新藏英现代藏语词典.txt 22.5 MB 265,157 藏文 .txt
བསྡུར་ཆོད་ཚིག་མཛོད་བསྡུས།-对照词典汇总.csv 16.5 MB 129,171 藏汉 .csv

ཡིག་ཆའི་བཀོད་པ། / 文件结构

རིགས་དབྱེའི་གྲངས། / 分类统计

རིགས་གྲངས། / 类别 ཡིག་ཆ་གྲངས། / 文件数 བརྒྱ་ཆ། / 占比 གོམས་ཚད། / 总大小
ཚིག་མཛོད་གཞན། / 其他 68 45.6% 644.3 MB
རྒྱུད་དཔེ་ཚིག་མཛོད། / 古籍词汇 22 14.8% 7.1 MB
ནང་བསྟན་དཔེ་ཆ། / 佛教文献 18 12.1% 46.8 MB
ཆེད་ལས་ཁྱབ་ཁོངས། / 专业词典 15 10.1% 31.0 MB
སྤྱི་ཡོངས་ཚིག་མཛོད། / 综合词典 11 7.4% 160.0 MB
ཆེད་གཅོད་ལག་ཆ། / 专项工具 9 6.0% 9.5 MB
ཁ་སྐད་ཚིག་མཛོད། / 方言口语 6 4.0% 11.8 MB

སྐད་རིགས་དབྱེ་བ། / 语言对分布

སྐད་རིགས། / 语言对 ཡིག་ཆ་གྲངས། / 文件数 བརྒྱ་ཆ། / 占比
གཞན། / 其他 56 37.6%
བོད་ཡིག / 藏文 30 20.1%
བོད་རྒྱ། / 藏汉 25 16.8%
བོད་དབྱིན། / 藏英 25 16.8%
ཆེད་ལས། / 专业 11 7.4%
བོད་གྲངས། / 藏梵 2 1.3%

རྣམ་གཞག་དབྱེ་བ། / 格式分布

རྣམ་གཞག / 格式 ཡིག་ཆ་གྲངས། / 文件数 བརྒྱ་ཆ། / 占比
.txt 125 83.9%
.csv 8 5.4%
.docx 7 4.7%
.xlsx 6 4.0%
.xls 2 1.3%
.doc 1 0.7%

རྣམ་གཞག་ཚད་ལྡན། / 格式规范

༡། TXT རྣམ་གཞག / 1. TXT格式

དཔེར་ན། / 示例:

ཀ་ཁ་ག་ང་།	k kh g ng	字母表 / alphabet
བོད་ཡིག	bod yig	藏文 / Tibetan language
སྐད་ཡིག	skad yig	语言 / language

ཁྱད་ཆོས། / 特点:

༢། CSV རྣམ་གཞག / 2. CSV格式

དཔེར་ན། / 示例:

"ཚིག་གཞི།","འགྲེལ་བཤད།","རིགས་གྲངས།"
"བོད་ཡིག","藏文;Tibetan","སྐད་ཡིག / 语言"
"ཚིག་མཛོད།","词典;dictionary","དཔེ་ཆ། / 书籍"

ཁྱད་ཆོས། / 特点:

༣། Excel རྣམ་གཞག / 3. Excel格式(XLSX/XLS)

བཀོད་པ། / 结构:

ཚིག་གཞི། / 词条 འགྲེལ་བཤད། / 释义 དབྱིན་ཡིག / 英文 རིགས་གྲངས། / 类别
བོད་ཡིག 藏文 Tibetan སྐད་ཡིག / 语言
ཚིག་མཛོད། 词典 dictionary དཔེ་ཆ། / 书籍

ཁྱད་ཆོས། / 特点:

༤། Word རྣམ་གཞག / 4. Word格式(DOCX/DOC)

བཀོད་པ། / 结构:

ཁྱད་ཆོས། / 特点:


ཚིག་མཛོད་རྒྱས་བཤད། / 词典详细信息

ཚིག་མཛོད་གྲངས་ཐོ།(ཆེ་སྐྱ་རིམ་པ་30) / 词典排行榜(Top 30按大小)

རིམ་པ། / 排名 ཚིག་མཛོད་མིང་། / 词典名称 ཡིག་ཆའི་ཚད། / 文件大小 ཚིག་གྲངས། / 词条数 སྐད་རིགས། / 语言对
2 རིག་པ།-Rigpa.txt 66.4 MB 919,103 其他
3 བོད་ལེགས་སྦྱར་ཚིག་མཛོད་ཆེན་མོ།-藏梵大词典.txt 66.0 MB 240,423 藏梵
4 Rangjung Yeshe Tibetan-English Dictionary of Buddhist Culture.txt 55.8 MB 539,704 藏英
5 རང་བྱུང་།-Rangjung.txt 51.9 MB 539,701 藏英
6 བོད་ཡིག་ཚིག་མཛོད་རྒྱ་མཚོ།-藏文辞海.txt 36.2 MB 229,902 藏文
7 རང་བྱུང་ཡེ་ཤེས།-RangjungYeshe.txt 30.0 MB 828,937 藏英
8 རྣལ་འབྱོར་སྤྱོད་པའི་ས་ཚིག་བསྡུས།-瑜伽师地论词汇表.txt 27.9 MB 547,035 其他
9 བོད་དབྱིན་དེང་རབས་ཚིག་མཛོད།-新藏英现代藏语词典.txt 22.5 MB 265,157 藏文
10 བོད་དབྱིན་རྒྱས་བཤད་ཚིག་མཛོད།-藏英详解百科词典.txt 21.6 MB 90,426 藏文
12 བོད་རྒྱ་ཚིག་མཛོད་ཆེན་མོ།-藏汉大辞典.txt 20.2 MB 160,506 藏汉
13 དུང་དཀར།-Dungkar.txt 16.6 MB 13,281 藏文
14 དུང་དཀར་ཚིག་མཛོད་ཆེན་མོ།.txt 16.6 MB 13,384 藏文
16 བསྡུར་ཆོད་ཚིག་མཛོད་བསྡུས།-对照词典汇总.csv 16.5 MB 129,171 藏汉
17 84000词汇表23.7.21.txt 16.3 MB 312,615 藏英
18 དུང་དཀར་ཚིག་མཛོད།.csv 15.7 MB 13,296 藏文
19 འབྲུག་།-DDC.txt 15.5 MB 248,039 其他
20 སྒོམ་སྡེ།-Gomde.txt 14.4 MB 33,645 其他
21 ཚིག་མཛོད་ཆེན་མོ།.csv 12.1 MB 49,639 藏文
22 སྒྲ་སྦྱོར་བམ་པོ།-翻译名义集.txt 11.9 MB 200,757 其他
23 all_terms.txt 9.6 MB 212,869 其他
24 The New English-Tibetan Dictionary.txt 9.2 MB 38,269 藏英
25 རྫོང་ཁ།-Dzongkha.txt 8.2 MB 142,480 藏英
26 རིན་ཆེན་མགོན་པོའི་ཚིག་མཛོད།-仁青贡布辞海.txt 7.3 MB 364,854 藏文
27 DDC Dzongkha Dictionary.txt 7.2 MB 91,235 藏英
28 པ་རིན་སེ་ཊོན།-Princeton.txt 7.0 MB 22,246 其他
29 dung-dkar-tshig-mdzod-chen-mo-Tib.txt 6.7 MB 13,384 其他
30 རྒྱ་བོད་བསྡུར་ཆོད་ཚིག་མཛོད།-汉藏对照词典.xlsx 6.5 MB 0 藏汉

གཞི་རྩའི་ཁྱད་ཆོས། / 数据统计

༡། སྤྱི་བསྡོམས། / 1. 总体统计

རིགས་གྲངས། / 项目 གྲངས་ཐང་། / 数值 དཔེར་བརྗོད། / 说明
ཡིག་ཆ་ཁྱོན། / 文件总数 149 ཡིག་ཆ་མི་འདྲ་བ། / 个不同词典文件
གཞི་རྩའི་ཁྱོན། / 总数据量 911.5 MB ཚང་མའི་ཁྱོན། / 所有文件总和
ཚིག་ཁྱོན། / 总词条数 10,348,236+ སྙིང་བསྡུས་གྲངས། / 估算数量
ཆ་སྙོམས་ཚད། / 平均文件大小 6.1 MB ཆ་སྙོམས། / 平均值
རིགས་གྲངས། / 类别数 7 གཙོ་བོའི་རིགས། / 主要分类
སྐད་རིགས། / 语言对 6 སྐད་རིགས་མི་འདྲ་བ། / 不同语言对
རྣམ་གཞག / 格式类型 6 ཡིག་ཆ་རྣམ་གཞག / 文件格式种类

༢། སྐད་རིགས་ཁྱད་ཆོས། / 2. 语言对统计

སྐད་རིགས། / 语言对 ཡིག་ཆ་གྲངས། / 文件数 བརྒྱ་ཆ། / 占比 བེད་སྤྱོད། / 用途
གཞན། / 其他 56 37.6% སྣ་ཚོགས། / 综合应用
བོད་ཡིག / 藏文 30 20.1% བོད་བོད། / 藏藏词典
བོད་རྒྱ། / 藏汉 25 16.8% སྐད་སྒྱུར། / 翻译
བོད་དབྱིན། / 藏英 25 16.8% སྐད་སྒྱུར། / 翻译
ཆེད་ལས། / 专业 11 7.4% ཐ་སྙད། / 术语
བོད་གྲངས། / 藏梵 2 1.3% ནང་བསྟན། / 佛教

༣། ཚད་ཀྱི་རིམ་པ། / 3. 规模分布

ཚད་ཀྱི་རིམ་པ། / 大小范围 ཡིག་ཆ་གྲངས། / 文件数 བརྒྱ་ཆ། / 占比
< 1 MB 63 42.3%
1-5 MB 41 27.5%
5-10 MB 19 12.8%
10-20 MB 14 9.4%
20-50 MB 8 5.4%
> 50 MB 4 2.6%

༤། ཚིག་གྲངས་ཁྱད་ཆོས། / 4. 词条数统计

ཚིག་གྲངས་རིམ་པ། / 词条范围 ཡིག་ཆ་གྲངས། / 文件数 བརྒྱ་ཆ། / 占比
< 10,000 64 43.0%
10,000-50,000 35 23.5%
50,000-100,000 20 13.4%
100,000-500,000 24 16.1%
> 500,000 6 4.0%

བསྡུར་ཞིབ། / 质量控制

ཚད་གཞི། / 质量标准

  1. ཀོད་གཟུགས་ཚད་ལྡན། / 编码标准
    • གཙོ་བོར་UTF-8ཀོད་གཟུགས་བེད་སྤྱོད། / 主要采用UTF-8编码
    • བོད་ཡིག་Unicode ཁུལ་U+0F00 - U+0FFF བེད་སྤྱོད། / 使用藏文Unicode范围U+0F00-U+0FFF
    • ཀོད་གཟུགས་ནོར་འཁྲུལ་ཞིབ་བཤེར། / 编码错误检测
  2. ནང་དོན་ཞིབ་བཤེར། / 内容检测
    • ཚིག་གཞི་དབྱེ་རྟགས་ཞིབ་བཤེར། / 词条分隔符检测
    • སྟོང་པའི་ཐིག་ཕྲེང་འཕྲོད་སྦྱོར། / 空行处理
    • རྣམ་གཞག་ཚད་ལྡན་ཞིབ་བཤེར། / 格式规范检测
  3. གཞི་རྩའི་ཡོངས་རྫོགས། / 数据完整性
    • ཡིག་ཆའི་ཚད་ངེས་བདེན། / 文件大小验证
    • ཚིག་གྲངས་བརྩི་ཞིབ། / 词条数量统计
    • བཀོད་པའི་ཚད་ལྡན། / 结构标准性

ཉེས་སྐྱོན་འཕྲོད་སྦྱོར། / 问题处理

ཉེས་སྐྱོན་རིགས། / 问题类型 འཕྲོད་སྦྱོར་ཐབས། / 处理方法
ཀོད་གཟུགས་ནོར་འཁྲུལ། / 编码错误 UTF-8དུ་བསྒྱུར། / 转换为UTF-8
དབྱེ་རྟགས་མི་མཐུན། / 分隔符不一致 གཅིག་མཐུན་དུ་བཟོ། / 统一格式
ཚིག་གཞི་སྟོང་པ། / 空词条 བསལ་བ། / 删除处理
རྣམ་གཞག་ནོར་བ། / 格式错误 བཅོས་སྒྲིག / 修正格式

སྤྱོད་ཕྱོགས་གྲོས་འདེབས། / 使用建议


བེད་སྤྱོད་གྲོས་འདེབས། / 使用指南

༡། Python སྤྱོད་ཐབས། / 1. Python使用示例

TXT ཡིག་ཆ་ཀློག་པ། / 读取TXT文件

# -*- coding: utf-8 -*-
# བོད་ཡིག་ཚིག་མཛོད་TXTཡིག་ཆ་ཀློག་པ། / 读取藏文词典TXT文件

import codecs

def load_dictionary(file_path):
    """
    ཚིག་མཛོད་ཡིག་ཆ་ཀློག་པའི་ལས་ཀ། / 加载词典文件
    """
    dictionary = {}
    with codecs.open(file_path, 'r', encoding='utf-8') as f:
        for line in f:
            line = line.strip()
            if not line:  # སྟོང་པའི་ཐིག་མི་སྤྱོད། / 跳过空行
                continue
            parts = line.split('\t')  # Tabདབྱེ་རྟགས། / Tab分隔
            if len(parts) >= 2:
                word = parts[0]
                definition = parts[1]
                dictionary[word] = definition
    return dictionary

# དཔེར་ན། / 示例
dict_path = '藏汉大辞典24.11.16.txt'
my_dict = load_dictionary(dict_path)
print(f"ཚིག་གྲངས། / 词条数: {len(my_dict)}")

CSV ཡིག་ཆ་ཀློག་པ། / 读取CSV文件

# -*- coding: utf-8 -*-
# CSVཡིག་ཆ་ཀློག་པ། / 读取CSV文件

import pandas as pd

def load_csv_dictionary(file_path):
    """
    CSVཚིག་མཛོད་ཀློག་པ། / 加载CSV词典
    """
    df = pd.read_csv(file_path, encoding='utf-8')
    return df

# དཔེར་ན། / 示例
csv_path = 'དུང་དཀར་ཚིག་མཛོད།.csv'
df = load_csv_dictionary(csv_path)
print(f"ཐིག་ཕྲེང་གྲངས། / 行数: {len(df)}")
print(df.head())  # སྔ་མའི་༥ཐིག་སྟོན། / 显示前5行

Excel ཡིག་ཆ་ཀློག་པ། / 读取Excel文件

# -*- coding: utf-8 -*-
# Excelཡིག་ཆ་ཀློག་པ། / 读取Excel文件

import pandas as pd

def load_excel_dictionary(file_path):
    """
    Excelཚིག་མཛོད་ཀློག་པ། / 加载Excel词典
    """
    df = pd.read_excel(file_path, engine='openpyxl')  # .xlsxལ། / 用于.xlsx
    # df = pd.read_excel(file_path, engine='xlrd')  # .xlsལ། / 用于.xls
    return df

# དཔེར་ན། / 示例
excel_path = '84000-glossary-2024-01-15.xlsx'
df = load_excel_dictionary(excel_path)
print(f"ཚིག་གྲངས། / 词条数: {len(df)}")

ཚིག་རྙེད་པ། / 词条查询

# -*- coding: utf-8 -*-
# ཚིག་རྙེད་པའི་ལས་ཀ། / 词条查询功能

def search_word(dictionary, word):
    """
    ཚིག་རྙེད་པ། / 查询词条
    """
    if word in dictionary:
        return dictionary[word]
    else:
        return "མ་རྙེད། / 未找到"

# དཔེར་ན། / 示例
word = "བོད་ཡིག"
result = search_word(my_dict, word)
print(f"{word}: {result}")

༢། R སྤྱོད་ཐབས། / 2. R使用示例

TXT ཡིག་ཆ་ཀློག་པ། / 读取TXT文件

# བོད་ཡིག་ཚིག་མཛོད་ཀློག་པ། / 读取藏文词典
# Encoding: UTF-8

load_dictionary <- function(file_path) {
  # ཡིག་ཆ་ཀློག་པ། / 读取文件
  lines <- readLines(file_path, encoding = "UTF-8")
  
  # སྟོང་པའི་ཐིག་བསལ། / 删除空行
  lines <- lines[nchar(lines) > 0]
  
  # དབྱེ་རྟགས་ཀྱིས་དབྱེ། / 按分隔符分割
  dict_list <- strsplit(lines, "\t")
  
  # གྲངས་ཐོ་བཟོ། / 创建数据框
  dict_df <- data.frame(
    word = sapply(dict_list, `[`, 1),
    definition = sapply(dict_list, `[`, 2),
    stringsAsFactors = FALSE
  )
  
  return(dict_df)
}

# དཔེར་ན། / 示例
dict_path <- "藏汉大辞典24.11.16.txt"
my_dict <- load_dictionary(dict_path)
print(paste("ཚིག་གྲངས། / 词条数:", nrow(my_dict)))

CSV ཡིག་ཆ་ཀློག་པ། / 读取CSV文件

# CSVཡིག་ཆ་ཀློག་པ། / 读取CSV文件

library(readr)

load_csv_dictionary <- function(file_path) {
  # CSVཀློག་པ། / 读取CSV
  df <- read_csv(file_path, locale = locale(encoding = "UTF-8"))
  return(df)
}

# དཔེར་ན། / 示例
csv_path <- "དུང་དཀར་ཚིག་མཛོད།.csv"
df <- load_csv_dictionary(csv_path)
print(paste("ཐིག་ཕྲེང་གྲངས། / 行数:", nrow(df)))
head(df)  # སྔ་མའི་༦ཐིག། / 前6行

Excel ཡིག་ཆ་ཀློག་པ། / 读取Excel文件

# Excelཡིག་ཆ་ཀློག་པ། / 读取Excel文件

library(readxl)

load_excel_dictionary <- function(file_path) {
  # Excelཀློག་པ། / 读取Excel
  df <- read_excel(file_path)
  return(df)
}

# དཔེར་ན། / 示例
excel_path <- "84000-glossary-2024-01-15.xlsx"
df <- load_excel_dictionary(excel_path)
print(paste("ཚིག་གྲངས། / 词条数:", nrow(df)))

འཕྲུལ་རིག་ཚད་ལྡན། / 技术规范

༡། Unicode ཁྱད་ཆོས། / 1. Unicode规范

བོད་ཡིག་Unicode ཁུལ། / 藏文Unicode范围

ཁུལ་མིང་། / 范围名称 ཁོད་གྲངས། / 编码范围 བཤད་པ། / 说明
གཙོ་བོའི་ཁུལ། / 主要区域 U+0F00 - U+0FFF བོད་ཡིག་གཙོ་བོ། / 藏文主体
རྐྱང་པའི་ཡི་གེ / 基本字母 U+0F40 - U+0F6C ཀ་ནས་ཨ་བར། / 从ཀ到ཨ
ཨ་ལི་ཀཱ་ལི། / 元音符号 U+0F71 - U+0F7E དབྱངས་ཀྱི་རྟགས། / 元音记号
གྲངས་ཀ། / 数字 U+0F20 - U+0F33 ༠་༡་༢...༩ / 0-9等
རྟགས་ཀྱི་མཚོན། / 标点符号 U+0F00 - U+0F1F །༎༑༔ སོགས། / 等标点

༢། མཉེན་ཆས་དང་ལྷན་ཐུབ་པ། / 2. 软件兼容性

རྒྱབ་སྐྱོར་ཡོད་པའི་མཉེན་ཆས། / 推荐软件

རིགས་གྲངས། / 类别 མཉེན་ཆས། / 软件名称 བཤད་པ། / 说明
ཡིག་ཆ་རྩོམ། / 文本编辑 VS Code, Sublime Text, Notepad++ UTF-8རྒྱབ་སྐྱོར། / 支持UTF-8
གྲངས་ཐོ་བཅོས། / 表格处理 Microsoft Excel, LibreOffice Calc Excelཡིག་ཆ། / Excel文件
གཞི་རྩ་བཅོས། / 数据处理 Python, R, MATLAB རྒྱུ་ཆས་མང་པོ། / 丰富工具库
སྐད་ཀློག / 文档阅读 Adobe Reader, Microsoft Word PDFདང་Word / PDF和Word

ཡིག་གཟུགས་གྲོས་འདེབས། / 推荐字体

༣། རྒྱུ་ཆའི་དགོས་མཁོ། / 3. 系统要求

རིགས་གྲངས། / 项目 དགོས་མཁོ། / 要求
བཀོལ་སྤྱོད་རིགས། / 操作系统 Windows 7+, macOS 10.10+, Linux
མྱུར་ཤེས། / 内存 ≥ 4 GB RAM
གསོག་ཁུངས། / 存储空间 ≥ 2 GB དགོས། / 可用空间
སྤྱོད་ཕྱོགས། / 软件 UTF-8རྒྱབ་སྐྱོར་ཡོད་པ། / 支持UTF-8

བེད་སྤྱོད་གན་དབང་། / 使用许可

གཞི་རྩ་འདི་དག་ནི་སློབ་སྦྱོང་དང་ཞིབ་འཇུག་ལ་བེད་སྤྱོད་ཆོག གཤོང་ཚོང་བེད་སྤྱོད་བྱེད་ན་མ་འདྲིས་གོང་དུ་འབྲེལ་བ་གནང་རོགས།
本数据库供学习和研究使用。商业用途需事先联系获得许可。

བེད་སྤྱོད་ཚད་ལྡན། / 使用条款

  1. བེད་སྤྱོད་ཆོག་པ། / 允许使用
    • སློབ་སྦྱོང་དང་ཞིབ་འཇུག / 学习和研究目的
    • སྐད་ཡིག་ལག་ཆ་གསར་སྐྲུན། / 语言工具开发
    • ཚིག་མཛོད་ཉེར་སྤྱོད་གསར་སྐྲུན། / 词典应用开发
    • སྐད་ཡིག་གཞི་རྩ་སྦྱོང་བརྡར། / 语言资源训练
  2. བེད་སྤྱོད་མི་རུང་བ། / 禁止使用
    • བསྒྱུར་བཅོས་མེད་པར་བཙོང་བ། / 未经修改直接销售
    • པར་དབང་གནད་དོན་བསལ་བ། / 删除版权信息
    • ཁུངས་མིང་རྫུན་མ་བཏགས་པ། / 虚假标注来源
    • ཁྲིམས་འགལ་ལས་དོན། / 非法用途

དཔྱད་གཏམ་རྣམ་གཞག / 引用格式

༡། རྒྱ་ཡིག་དཔྱད་གཏམ། / 1. 中文引用

བོད་ཡིག་ཚིག་མཛོད་གཞི་རྩའི་ཕྱོགས་བསྡུས།(2026)。藏文词典数据库集成[数据集]。版本1.0。检索自 [URL]

༢། དབྱིན་ཡིག་དཔྱད་གཏམ། / 2. 英文引用

Tibetan Dictionary Database Collection (2026). Tibetan Dictionary Database Collection [Dataset]. Version 1.0. Retrieved from [URL]

༣། བོད་ཡིག་དཔྱད་གཏམ། / 3. 藏文引用

བོད་ཡིག་ཚིག་མཛོད་གཞི་རྩའི་ཕྱོགས་བསྡུས། (2026ལོ།)། བོད་ཡིག་ཚིག་མཛོད་གཞི་རྩའི་ཕྱོགས་བསྡུས། [གཞི་རྩའི་ཚོགས་བསྡུས།]། པར་གཞི་༡.༠། [URL]ནས་རྙེད།

༤། BibTeX རྣམ་གཞག / 4. BibTeX格式

@dataset{tibetan_dictionary_2026,
  title = {བོད་ཡིག་ཚིག་མཛོད་གཞི་རྩའི་ཕྱོགས་བསྡུས། Tibetan Dictionary Database Collection},
  author = {{Tibetan Dictionary Project}},
  year = {2026},
  month = {1},
  version = {1.0},
  note = {149ཡིག་ཆ།, 911.5 MB, 10,348,236+ཚིག། / 149 files, 911.5 MB, 10,348,236+ entries},
  url = {[URL]},
  language = {Tibetan, Chinese, English}
}

གསར་བཅོས་ལོ་རྒྱུས། / 更新历史

v1.0 (2026ལོ་1ཟླ་30ཉིན། / 2026年01月30日)


བཀའ་དྲིན་རྗེས་དྲན། / 致谢

གཞི་རྩའི་ཁུངས་ལ་བཀའ་དྲིན། / 数据来源感谢

བོད་ཡིག་ཚིག་མཛོད་གྲངས་འབེལ་ལ་ཞབས་ཞུ་གནང་བའི་ཚོགས་པ་དང་གང་ཟག་ཐམས་ཅད་ལ་ཆེས་ཐུགས་རྗེ་ཆེ།
特别感谢以下组织和个人为藏文词典数字化做出的贡献:

ཚོགས་པ་དང་ལས་འཆར། / 机构和项目

མཁས་དབང་དང་རྩོམ་པ་པོ། / 学者和作者

ལས་གཞི་དང་རྒྱལ་ཁབ། / 出版机构

འཕྲུལ་རིག་རོགས་རམ། / 技术支持

སྤྱི་དང་བཀའ་དྲིན། / 特别感谢

ཆོས་གཞུང་སྐད་གཉིས་ལོ་ཙཱ་བ་འབུམ་རམས་པ་ལི་འཇའ་སྙིང་ངམ་རིན་ཆེན་མགོན་པོ་མཆོག 牛津大学访问学者、佛典译师李佳宁(仁钦贡布)
ཀྲུང་གོ་མི་དམངས་སློབ་ཆེན་འབུམ་རམས་པ་གཡུང་དྲུང་འཇིགས་མེད། 中国人民大学人类学博士 永中久美
བོད་ལྗོངས་སློབ་ཆེན་འབུམ་རམས་པ་བློ་བཟང་། 西藏大学博士 洛桑
བོད་རིག་པ་ཞིབ་འཇུག་ལྟེ་གནས་འབུམ་རམས་པ་དགེ་ལེགས། 中国藏学研究中心博士 格勒
བོད་ཡིག་ཚིག་མཛོད་འཚོལ་བསྡུ་བ་འཇིགས་མེད། 藏文词库整理者 晋美
清华大学美术学院赵健教授 | 中国社会科学院软件研究所龙从军教授
感谢所有为藏文文化保护和传承做出贡献的杰出学者、工程师和志愿者!


སྤྱི་བསྡོམས། / 总结

ཡིག་ཆ་འདི་ནི་བོད་ཡིག་ཚིག་མཛོད་གྲངས་འབེལ་གྱི་ཁྱབ་ཁོངས་ནང་གལ་ཆེའི་འབྲས་བུ་ཞིག་ཡིན། ཚིག་མཛོད་ཡིག་ཆ་149ཟླ་སྒྲིལ། གཞི་རྩའི་ཁྱོན་911.5 MBདང་ཚིག་10,348,236+། རིགས་7དང་རྣམ་གཞག་༦། བེད་སྤྱོད་ཁྱབ་ཁོངས་མང་པོ།
本数据库是藏文词典数字化领域的重要成果,整合了149个词典文件,总数据量达到911.5 MB,包含超过10,348,236条词条。数据涵盖7大类别,支持6种主要文件格式,适用于多个领域。

གསལ་བསྒྲགས་འདི་བོད་ལྗོངས་དཔལ་ཡོན་ཚིག་མཛོད་ཡིག་ཆའི་ལས་འཆར་ཚོགས་པའམ་དཔལ་ཡོན་གསར་གཏོད་སྡེ་ཚན་ནས་བརྩམས་ཤིང་འཛིན་སྐྱོང་བྱེད་བཞིན་ཡོད། | གསལ་བསྒྲགས་འདིར་འཁོད་པའི་ནང་དོན་གང་བྱུང་ལ་སྤྱི་སྒེར་གཉིས་ནས་དངུལ་གྲོན་བཏང་མེད།
本报告由拜云藏文词典语料库项目组(拜云创新实验室)编写和维护 | 本报告提及的内容均无任何个人和组织资助,完全由社区成员自发贡献 | 2026年01月30日