Tag Archives: 乱码

[转]vim打开中文(gbk)乱码

转自:http://www.cnblogs.com/hopeworld/archive/2011/04/20/2022331.html
Vim有四个跟字符编码方式有关的选项,encoding、fileencoding、fileencodings、termencoding(这些选项设置请参考Vim文档中encoding-names章节),它们的意义如下:

  • encoding
    encoding是Vim内部使用的字符编码方式,包括Vim的buffer(缓冲区)、菜单文本、消息文本等。默认[……]

继续阅读

Python写UTF8文件,UE、记事本打开依然乱码的问题

现象:使用codecs打开文件,写入UTF-8文本,正常无错误。用vim打开正常,但记事本、UE等打开乱码。

原因:一般写文本时,默认是没有BOM头的,即编辑器不知道这个文本文件是神马编码,只能智能detect,这个detect有的弱有的强,比如UE、记事本就挂了,认为是ASCII格式的,于是就乱码了。

解决方法:如果为了编辑器打开正常,可以加入BOM编码。但一定要慎重,一旦加入后,头部会增加2~3个字节,如果程序再读取,显然会出错。这个如果使用UE编辑过PHP代码抓过狂的都应该懂得[……]

继续阅读

BeautifulSoup中文乱码解决问题

如果中文页面编码是gb2312,gbk,在BeautifulSoup构造器中传入fromEncoding=”gb18030″参数即可解决乱码问题,即使分析的页面是utf8的页面使用gb18030也不会出现乱码问题!

转载自:《beautifulsoup解析中文网页乱码》

2012.9.19更新:

实际上,fromEncoding=”gb18030″并不是一劳永逸的方法,当面对iso-8859-1编码的中文网页时[……]

继续阅读

关于mutt发邮件的中文乱码的问题

首先,mutt是很智能的,不要低估了人家的智商。

默认来说,是根据系统的LANG变量来评估所需要试用的编码的。

以中文为例

Linux Screen窗口中文乱码问题

转载自:LINUX SCREEN窗口中文乱码问题,感谢原作者!

环境:Linux Dist: CentOS 4.3,locale: en_US.UTF-8, .vimrc: set fencs=gbk

目标:终端使用 less/more/grep 等命令正确显示 GBK 编码文件内容,vim 正确显示 GBK 编码文件汉字

症状:

1. 系统自带 gnome-terminal 在设置终端编码为 GBK 后,能达到目标。

2. 使用 xshell 在 windows[……]

继续阅读