您的位置:首页 > 数据库 > MySQL

MySQL将utf8字符集改为utf8mb4

2017-09-06 13:43 405 查看
前言

今天在查看tomcat日志时发现了一个错误:Cause: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x82\xF0\x9F...' for column 'name' at row 1

在网上查找了说是mysql的字符集编码的问题,因为mysql的utf8编码最大是3个字节,而现在比较流行的emoji表情是四个字节的,所以导致mysql报错。MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换。所以utf8mb4要比utf8浪费点空间,但是还是推荐使用utf8mb4,原因就是手机上网的用户太多了, 随便输入一个[emoji]表情mysql就存不了,其合理性可想而知。
解决方案

因为我们使用的是阿里云的rds mysql,所以不能修改配置文件,所以只能修改数据库和表和字段
#数据库
ALTER DATABASE database_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
#表
ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
#字段
ALTER TABLE table_name CHANGE column_name column_name VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
然后我们使用sql语句检查表的编码
SHOW CREATE TABLE `user`;

关于mysql的字符集还是有很多知识的,比如utf8_bin与utf8_unicode_ci和utf8_unicode_cs还有utf8_general_ci和utf8_general_cs他们之间的区别与联系都可以了解一下哦
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息