为Msql数据库编码UTF8过滤emoj表情 有更新!
由于mysql的历史原因.其UTF-8是一个残缺品.最多支持3字节编码的UTF-8编码. 而要支持4字节的UTF-8编码,实际要把字符集编码修改为
utf8mb4
. 如果表已经通过存在,修改风险比较大. 那我们该怎么办呢.
由于mysql的历史原因.其UTF-8是一个残缺品.最多支持3字节编码的UTF-8编码. 而要支持4字节的UTF-8编码,实际要把字符集编码修改为
utf8mb4
. 如果表已经通过存在,修改风险比较大. 那我们该怎么办呢.
虽然这个问题一直在接受新知识,同时不断更正自己对字符集的理解. 但是时间久了,难免自己的知识理解又模糊了. 在此把一些常用的知识点做一个简单的梳理.
首先回答一下如下问题:
- 汉字的GBK编码占用几个字节.
- 一个汉字的UTF-8编码占用几个字节.
- UTF-8与UNICODE或者UTF-16的关系是什么.
- 一个UNICODE编码怎么转换成UTF-8编码.
- Java的char内部到底存储的是什么.
回答完如上几个问题基本日常的问题都解决了.