togscc
TypeScript icon, indicating that this package has built-in type declarations

1.3.1 • Public • Published

通用规范汉字表

No Dependencies npm package Coverage Status

最权威的《通用规范汉字表》(Table of General Standard Chinese Characters),数据来源 2013-06-01 中华人民共和国教育部发布的《通用规范汉字表》

⚠️ 注意:拼音注音没有找到官方数据来源,数据来源《维基词典》汉语拼音索引。PDF 数据存放在 @v1.0.0

安装

npm install togscc --save

使用

import data from 'togscc/data/characters.json';
// data 输出 ===>
[
  "一","乙","二","十","丁","厂","七","卜","八","人","入","儿","匕","几",
  // ....
]
import characters from 'togscc/dist/characters';
import pinyin from 'togscc/dist/pinyin';
import shendiao from 'togscc/dist/shendiao';
import raw from 'togscc/dist/pinyin.raw';
import togscc from 'togscc';

console.log(togscc['正']) // => ["zhēng","zhèng"]
console.log("你好世界!".split('').map((han) => togscc[han] ? togscc[han] : han))
// => ["nǐ", ["hǎo","hào"], "shì", "jiè", "!"]

数据说明

文件名 说明 数据说明
characters.txt 汉字(8105个汉字),行号对应字序 ⚠️ 维护数据
characters.csv 汉字拼音,表格数据 -
characters.json 汉字,JSON 格式,数组顺序对应字序 -
characters.min.json characters.min.json 的压缩数据 -
pinyin.raw.txt 拼音 ⚠️ 维护数据
pinyin.raw.json 拼音,JSON 格式,数组顺序对应字序 -
pinyin.raw.min.json pinyin.raw.json 的压缩数据 -
pinyin.raw.effect.json 拼音与文字在一行数组中 -
pinyin.txt 拼音,行号对应 characters.txt 行号 -
pinyin.json 拼音,JSON 格式,数组顺序对应 characters.json 数组顺序 -
pinyin.min.json pinyin.json 的压缩数据 -
pinyin.duo.json 多音汉字数据 -
pinyin.duo.min.json pinyin.duo.json 的压缩数据 -
shendiao.json 字母 + 声调数据 -
shendiao.all.json 字母 + 声调 + 非字母声调数据 -
shendiao.object.json 字母 + 声调声调 JSON 数据 -
fanti.txt 简繁体字数据 ⚠️ 维护数据
simplified.convert.json -> 体字 -
traditional.convert.json -> 体字 -

⚠️ 注意:行号(或数组顺序)对应字序,字序遵循《GB13000.1 字符集汉字字序(笔画序)规范》的规定

更多 CDN 数据访问:https://unpkg.com/togscc/

characters.txt

一
乙
二
十
....

characters.json

[
  "一","乙","二","十","丁","厂","七","卜","八","人","入","儿","匕","几",
  // ....
]

pinyin.raw.txt

ā 吖 阿 啊 锕 腌
á 啊
ǎ 啊
à 啊
a 啊
āi 哎 哀 埃 挨 唉 锿
ái 挨 皑 癌
ǎi 毐 欸 嗳 矮 蔼 霭
ài 艾 砹 唉 爱 隘 碍 嗳 嗌 嫒 瑷 叆 暧
ān 安 垵 桉 氨 庵 谙 鹌 𩽾 鞍 盦
ǎn 俺 埯 唵 铵
àn 犴 岸 按 胺 案 暗 黯

pinyin.raw.json

{
  "ā": [ "吖", "阿", "啊", "锕", "腌" ],
  "á": [ "啊" ],
  "ǎ": [ "啊" ],
  "à": [ "啊" ],
  "a": [ "啊" ],
  // ....
}

pinyin.raw.effect.json

[
  [ "ā", "吖", "阿", "啊", "锕", "腌" ],
  [ "á", "啊" ],
  [ "ǎ", "啊" ],
  [ "à", "啊" ],
  [ "a", "啊" ],
  // ....
]

pinyin.txt

dīng
chǎng
qī
bo bǔ
bā
rén
rù
ér
bǐ
jī jǐ

pinyin.json

行号对应汉字字序。

[
  "yī",
  "yǐ",
  "èr",
  "shí",
  "dīng",
  "chǎng",
  "qī",
  [
    "bo",
    "bǔ"
  ],
  "bā",
  // ....
]

pinyin.duo.json

{
  "卜": [ "bo", "bǔ" ],
  "几": [ "jī", "jǐ" ],
  "了": [ "le", "liǎo" ],
  "干": [ "gān", "gàn" ],
  // ....
}

shendiao.json

[
  "ā", "ē", "ī", "ō", "ū",
  "á", "é", "í", "ó", "ú",
  "ǎ", "ě", "ǐ", "ǒ", "ǔ",
  "à", "è", "ì", "ò", "ù",
  "a", "e", "i", "o", "u"
]

shendiao.object.json

{
  "ā": "a", "ē": "e", "ī": "i", "ō": "o", "ū": "u",
  "á": "a", "é": "e", "í": "i", "ó": "o", "ú": "u",
  "ǎ": "a", "ě": "e", "ǐ": "i", "ǒ": "o", "ǔ": "u",
  "à": "a", "è": "e", "ì": "i", "ò": "o", "ù": "u"
}

shendiao.all.json

[
  "ā", "ɑ̄", "ē", "ī", "ō", "ū", "ǖ", "Ā", "Ē", "Ī", "Ō", "Ū", "Ǖ",
  "á", "ɑ́", "é", "í", "ó", "ú", "ǘ", "Á", "É", "Í", "Ó", "Ú", "Ǘ",
  "ǎ", "ɑ̌", "ě", "ǐ", "ǒ", "ǔ", "ǚ", "Ǎ", "Ě", "Ǐ", "Ǒ", "Ǔ", "Ǚ",
  "à", "ɑ̀", "è", "ì", "ò", "ù", "ǜ", "À", "È", "Ì", "Ò", "Ù", "Ǜ",
  "a", "ɑ", "e", "i", "o", "u", "ü", "A", "E", "I", "O", "U", "Ü"
]

fanti.txt

对在部分义项和用法上不简化的“瞭、乾、藉、麽”

  • :读liào时不简化作“了”,如“瞭望”“瞭哨”。
  • :读qián时不简化作“干”,如“乾坤”“乾隆”。
  • :读jí或用于慰藉、衬垫义时不简化作“借”,如“狼藉(jí)”“枕藉(jiè)”。
  • :读mó时不简化作“么”,如“幺麽小丑”。
皑(皚)
嗳(噯)
蔼(藹)
边(邊)
编(編)
贬(貶)
变(變,変)

simplified.convert.json

{
  "贬": "貶",
  "变": [
    "變",
    "変"
  ],
  "辩": "辯",
  "辫": "辮"
  // ....
}

traditional.convert.json

{
  "變": "变",
  "変": "变",
  "辯": "辩",
  "辮": "辫",
  // ...
}

其它工具

  • province-city-china 最全最新中国【省、市、区县、乡镇街道】json,csv,sql 数据

参考资料

License

Licensed under the MIT License.

Package Sidebar

Install

npm i togscc

Weekly Downloads

37

Version

1.3.1

License

MIT

Unpacked Size

1.2 MB

Total Files

33

Last publish

Collaborators

  • wcjiang