unicode to code point
Unicode,也叫统一码、万国码等,使用它可表示世界上大部分的文字语言,其中 UTF-8/UTF-16 是一种针对 Unicode 的可变长度字符编码。
而对于 Unicode 中的每一个字符,都有一个独一无二的 ID,也叫码位,称作 code point
。
API
JS
在 Javascript 中,可借助于 String API
进行转化
// => 127817'🍉'.codePointAt(0)
// => '🍉'String.fromCodePoint(127817)
Python
ord
: ordinal 的缩写,获取其 codePointchr
: character 的缩写,根据 codePoint 获取其字符
> ord(u'🍉')127817
> chr(127817)'🍉'