您好,欢迎访问代理记账网站
  • 价格透明
  • 信息保密
  • 进度掌控
  • 售后无忧

8.文本处理(编码解码/文件操作)

本章主要从文本处理、系统监控、日志、FTP、邮件监控、微信监控等方面来介绍基础运维的相关知识。

8.1 文本处理

在日常的运维工作中一般都离不开与文本,如日志分析、编码转换、ETL加工等。本节从编码原理、文本操作、读写配置文件、解析XML等实用编程知识出发,希望能抛砖引玉,为读者在处理文本问题时提供可实践的方法。

8.1.1 Python编码解码

我们编写程序处理文本的时候,不可避免地遇到各种各样地编码问题,如果对编码解码过程一知半解,遇到这类问题就会很棘手。本小节从编码解码地原理出发,结合Python 3代码实例一步步揭开文本编码的面纱,编码解码的原理是相通的,学会编码解码,对学习其他编程语言也非常有帮助。

首先我们需要明白,计算机只处理二进制数据,如果需要处理文本,就需要将文本转换为二进制数据,再由计算机进行处理。

将文本转换为二进制数据就是编码,将二进制数据转换为文本就是解码。编码和解码要按照一定的规则进行,这个规则就是字符集。

以常见的ASCII编码为例,字符'a'在ASCII码表中对应的数据是97,二进制是1100001.下面再Python中验证以下:

由于ACSII编码只占用一个字节,也就是二进制8位,共有256种可能,完全可以覆盖英文大小写字母及特殊字符。而我们中文汉字远超过256个,使用ASCII编码的一个字节来处理中文显然是不够用,于是我国就制定了支持中文的GB2312编码,使用两个字节,可以支持共65


分享:

低价透明

统一报价,无隐形消费

金牌服务

一对一专属顾问7*24小时金牌服务

信息保密

个人信息安全有保障

售后无忧

服务出问题客服经理全程跟进