当使用bytes.decode("gb2312")是出现题述问题。
bytes.decode("gb2312")
出现这个问题的原因是处理的字符中夹杂特殊字符是gb2312字符集中没有的,因而只需要使用更大一点的字符集GB18030去解析即可。
GB18030
另外GB2312,gbk,gb18030字符集大小顺序为:GB2312 < GBK < GB18030