utf-8与utf-8-sig的区别(csv文件 乱码)

参考链接:

https://blog.csdn.net/qq_40258748/article/details/96306878

前言:在写入csv文件中,出现了乱码的问题。

解决:utf-8 改为utf-8-sig

区别如下

1、”utf-8“ 是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理, 也就会发生类似上边的错误.

2、“uft-8-sig"中sig全拼为 signature 也就是"带有签名的utf-8”, 因此"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理,与文本内容隔离开,也是我们期望的结果.


utf-8与utf-8-sig的区别(csv文件 乱码)
https://fulequn.github.io/2020/10/Article202010134/
作者
Fulequn
发布于
2020年10月13日
许可协议