python编码知识点(倒序更新)


decodeencode区别

在python中进行编码转换都是通过unicode作为中间值实现的。

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(gb2312),表示将gb2312编码的字符串转换成unicode编码。

encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(gb2312),表示将unicode编码的字符串转换成gb2312编码。

如何正确打印中文

>>>  import  codecs
>>> with codecs. open ( "test.txt" 'r' 'gbk' ) as handle:
...      for  ln  in  handle:
...          print (ln)
... 
中国
>>> with  open ( "test.txt" 'rb' ) as handle:
...     ch_str  =  handle.read()
... 
>>> ch_str
b '\xd6\xd0\xb9\xfa'
>>>  print (ch_str.decode( "gbk" ))
中国

中文标点符号unicode码

名称  Unicode 符号

句号    3002  。

问号    FF1F  ?

叹号       FF01  !

逗号    FF0C  ,


顿号    3001  、

分号    FF1B  ;

冒号    FF1A  :

引号    300C  「

      300D  」

引号    300E  『

      300F  』

引号    2018  ‘

      2019  ’

引号    201C  “ 

      201D  ” 

括号    FF08  (

      FF09  )

括号    3014  〔

      3015  〕

括号    3010  【

      3011  】

破折号      2014  — 

省略号      2026  …

连接号      2013  – 

间隔号      FF0E  .

书名号      300A  《

       300B  》

书名号      3008  〈

       3009  〉

相关推荐
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页