python编码知识点(倒序更新)


decodeencode区别

在python中进行编码转换都是通过unicode作为中间值实现的。

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(gb2312),表示将gb2312编码的字符串转换成unicode编码。

encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(gb2312),表示将unicode编码的字符串转换成gb2312编码。

如何正确打印中文

>>> import codecs
>>> with codecs.open("test.txt"'r''gbk') as handle:
...     for ln in handle:
...         print(ln)
... 
中国
>>> with open("test.txt"'rb') as handle:
...     ch_str = handle.read()
... 
>>> ch_str
b'\xd6\xd0\xb9\xfa'
>>> print(ch_str.decode("gbk"))
中国

中文标点符号unicode码

名称  Unicode 符号

句号    3002  。

问号    FF1F  ?

叹号       FF01  !

逗号    FF0C  ,


顿号    3001  、

分号    FF1B  ;

冒号    FF1A  :

引号    300C  「

      300D  」

引号    300E  『

      300F  』

引号    2018  ‘

      2019  ’

引号    201C  “ 

      201D  ” 

括号    FF08  (

      FF09  )

括号    3014  〔

      3015  〕

括号    3010  【

      3011  】

破折号      2014  — 

省略号      2026  …

连接号      2013  – 

间隔号      FF0E  .

书名号      300A  《

       300B  》

书名号      3008  〈

       3009  〉

©️2020 CSDN 皮肤主题: 编程工作室 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值