1. 首先先来说说中文的问题。众所周知,作死的python经常和中文过不去

每次,开头必须声明

# coding: utf-8

或者是

# -*- coding: utf-8  -*-

然而,被坑过的人都知道。这样是远远不够的,不折腾死你python是不会罢休的

print u"你好"       # 打印成unicode的类型

print u"你好".encode('gbk')   # 打印成unicode的类型,再转码成'gbk'的

print "你好".decode('gbk').encode('gbk')       # 解码成unicode再转码成''gbk类型的

在powershell中,上述三种才能显示出中文。而raw_input(">>> ")就只能用后面2种了。

这是为什么呢?让我们来试验一下吧。

s1 = u"你好"

s2 = u"你好".encode('gbk')

s3 = "你好".decode('utf-8').encode('gbk')

print type(s1)

输出<type 'unicode'>

print type(s2)

输出<type 'str'>

print type(s3)

输出<type 'str'>

显然,放在raw_input(">>> ")里面的都是被包含" "的str字符串。你用第一种,unicode

类型的来替换str型的,当然会报错啦。

------------------------------------------------------------------------------------------------------

2. 接下来说说if语句和for语句的

txt = "123"

if 1 in txt:

print "Right"

很显然,这也是类型不对应导致的错误,所以,

data = raw_input(u"取值".encode('gbk'))

if data > "2" / if "2" in data:

这种的,同样要注意,两边都要是字符串

------------------------------------------------------------------------------------------------------

3.还有一种更变态的错法,就是当不是unicode类型的汉字,用到for语句时,元素个数会发生改变。

s1 = "你好"

s2 = s1.decode('utf-8')

s3 = s2.encode('gbk')

把字符串变成列表的三种方法, 就是下面的a依次变成a, a.split(), list()

def list(a):

empty = []

for i in a:

empty.append(i)

print len(a)

list(s1)

list(s2)

list(s3)

最终我们会发现只有unicode类的汉字的列表元素个数始终正确。而在这三种构成列表的方法中,也只有

a.split()时三种汉字的列表元素个数是相等的。所以,为了安全起见,我们以后用for...in...时,还是用u

型的汉字为好。最好都用unicode型的汉字。

那么,问题又来了,万一遇到始终都是str字符串型的raw_input()时该怎么办呢?

import sys

raw_input(">>> ").decode(sys.stdin.encoding)如此一来。里面就也弄不了中文提示了。

参考: http://www.tuicool.com/articles/yMrMzmQ

【编码问题】if,for语句与中文编码的更多相关文章

  1. {MySQL数据库初识}一 数据库概述 二 MySQL介绍 三 MySQL的下载安装、简单应用及目录介绍 四 root用户密码设置及忘记密码的解决方案 五 修改字符集编码 六 初识sql语句

    MySQL数据库初识 MySQL数据库 本节目录 一 数据库概述 二 MySQL介绍 三 MySQL的下载安装.简单应用及目录介绍 四 root用户密码设置及忘记密码的解决方案 五 修改字符集编码 六 ...

  2. 数据库char varchar nchar nvarchar,编码Unicode,UTF8,GBK等,Sql语句中文前为什么加N(一次线上数据存储乱码排查)

    背景 公司有一个数据处理线,上面的数据经过不同环境处理,然后上线到正式库.其中一个环节需要将数据进行处理然后导入到另外一个库(Sql Server).这个处理的程序是老大用python写的,处理完后进 ...

  3. sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改变标准输出的默认编码

    不论使用urllib还是使用requests库经常会遇到中文编码错误的问题,我就经常遇到,因为python安装在windows平台上,cmd的默认编码为GBK,所以在cmd中显示中文时会经常提示gbk ...

  4. Python 编码简单说

    先说说什么是编码. 编码(encoding)就是把一个字符映射到计算机底层使用的二进制码.编码方案(encoding scheme)规定了字符串是如何编码的. python编码,其实就是对python ...

  5. R语言读写中文编码方式

    最近遇到一个很头疼的事,就是 R语言读写中文编码方式.在网上找到了一篇博文,谢谢博主的精彩分享,让我很快解决了问题,在此也分享一下 R语言读写数据的方法很多,这里主要是我在使用read.csv/rea ...

  6. python 之 utf-8编码的秘密

    python3的默认编码方案是utf-8编码,看了些资料,来做总结. 要说utf-8,就要说说unicode,要说unicode,就要说ASCII,我们还是慢慢来. 1.ASCII ASCII编码最初 ...

  7. linux设置语言编码

    前段时间在服务器上安装了centos6.2版本,当初安装时语言选择英文.这本来也没有什么问题,直到前一段时间.我的同事发现部署的web项目中出现乱码情况.但中文作为参数进行传递到下一个页面的时候就乱码 ...

  8. java编码问题深入总结

      Java语言能够这么普遍的应用,与其国际化的能力是 分不开的,国际化的编码是Java国际化中最重要的一个组成部分,Java的国际化编码能力与其使用Unicode编码是直接相关的.在Java中,任何 ...

  9. Java所有编码问题参考手册

     一.编码基本知识 1.iso8859-1 ——属于单字节编码,最多能表示的字符范围是 0-255,应用于英文系列.比如,字母 'a' 的编码为0x61=97. 很明显,iso8859-1 编码表示的 ...

随机推荐

  1. Ubuntu14.04 bind9配置

    apt-get install bind9 配置域名: cn.archive.ubuntu.com 对应IP: 10.60.233.244 vim /etc/bind/name.conf.defaul ...

  2. 那些年,我们被耍过的bug——haslayout

    你被IE的bug耍过几次了? IE,这个令所有网站设计人员讨厌,但又不得不为它工作的浏览器.不论是6.7还是8,它们都有一个共同的渲染标准haslayout,所以haslayout 是一个非常有必要彻 ...

  3. MySql 如何实现不同数据库同步【2个】

    环境要求: Windows 操作系统 需要Mysql 3.23.15以后的版本. 假设数据库A为主机,数据库B为从机(A向B提供同步服务,即B中的数据来自A) A机器:IP=10.10.151.166 ...

  4. Alamofire4.0 在 CocoaPods无法更新的问题

    因为淘宝镜像已经不能使用,使用新的镜像升级ruby到最新状态 platform :ios, '9.0'use_frameworks! target '输入你的工程名字' do pod 'Alamofi ...

  5. asp.net 如何引用dll

    这要看你引用dll文件是什么文件,是单纯的类库还是外部或自定义控件dll文件. 如果是类库dll文件,引用的步骤是这样的:在解决方案管理器中,选中要添加引用的项目或网站-右击-添加引用-选择要添加的d ...

  6. SpringMVC同时使用<mvc:resources … />和日期转换Formatter时出现问题的解决方法

    很久没更新博文了,不是没有学习,而是很多东西记在OneNote里面,收获很多啊,因为各种杂事,所以对于博客很久没更新了. 个人觉得:博客比起OneNote或者为知笔记之类的云笔不同在于博客应该记载的是 ...

  7. fedora22 mysql安装

    fedora19以后好像取消了对mysql的支持,看其他人好像说是用的mariadb的.centos里用yum安装的方式,放到fedora中不能用,所以找了很多资料,尝试了一种可行的办法. 在Fedo ...

  8. Python学习笔记——基础篇【第七周】———进程、线程、协程篇(socket基础)

    http://www.cnblogs.com/wupeiqi/articles/5040823.htmlhttp://i.cnblogs.com/EditPosts.aspx?postid=55437 ...

  9. java 生成条形码

    package com.sun.erwei; import java.awt.image.BufferedImage;import java.io.ByteArrayOutputStream;impo ...

  10. android studio导入第三方源码模块

    从网上得到的但三方源码模块,如果直接导入到自己的项目里的时候,可能需要比较长的时间,甚至不成功. 在导入之间,还是应该将模块里的 build.gradle 编辑一下,使其与自己的android stu ...