微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么在MySQL时ruby无法检测到无效的编码?

我正在从YouTube提取一些RSS提要,这些提要具有无效的UTF8.我可以使用创建一个类似的ruby字符串

bad_utf8 = "\u{61B36}"
bad_utf8.encoding # => #<Encoding:UTF-8>
bad_utf8.valid_encoding? # => true

Ruby认为这是有效的UTF-8编码,我很确定这不是.

当与MysqL交谈时,我得到了这样的错误

require 'MysqL2'
client = MysqL2::Client.new(:host => "localhost", :username => "root")
client.query("use test");

bad_utf8 = "\u{61B36}"
client.query("INSERT INTO utf8 VALUES ('#{moo}')")

# Incorrect string value: '\xF1\xA1\xAC\xB6' for column 'string' at row 1 (MysqL2::Error)

在将它们发送给MysqL之前,如何检测或修复这些无效的编码类型?

解决方法:

可能是因为代码点不在basic multilingual plane
 这是MysqL在其“ utf8”字符集中允许的唯一字符.

较新版本的MysqL具有另一个字符集,名称为“ utf8mb4”,该字符集为supports unicode characters outside the BMP.

但是您可能不想使用它.仔细考虑您的用例.很少有真正的人类语言(如果有的话)在BMP之外使用字符.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐