字符串拼接、算长度、截取
在Python开发过程中,为了实现某项功能,经常需要对某些字符串进行特殊处理,如拼接字符串、截取字符串、格式化字符串等。在Python开发过程中,为了实现某项功能,经常需要对某些字符串进行特殊处理,如拼接字符串、截取字符串、格式化字符串等。下面将对 Python 中常用的字符串操作方法进行介绍。
1、拼接字符串
使用“+”运算符可完成对多个字符串的拼接,“+”运算符可以连接多个字符串并产生一个字符串对象。
例如,定义两个字符串,然后使用“+”运算符连接,代码如下:
str1 = "我爱学习" str2 = "我爱跑步" print(str1+"--"+str1) #输出 我爱学习--我爱跑步
字符串不允许直接与其他类型的数据拼接,例如,使用下面的代码将字符串与数值拼接在一起,将产生异常。
str = "我爱学习" num = 123 print(str+num) # 产生错误异常
解决该问题,可以将整数转换为字符串,然后以拼接字符串的方法输出该内容。将整数转换为字符串,可以使用str()函数,修改后的代码如下:
str = "我爱学习" num = 123 print(str+str(num)) #输出 我爱学习123
2、计算字符串的长度
由于不同的字符所占字节数不同,所以要计算字符串的长度,需要先了解各字符所占的字节数。在Python中,数字、英文、小数点、下划线和空格占一个字节:一个汉字可能会占2-4个字节,占几个字节取决于采用的编码。汉字在 GBK/GB2312 编码中占 2 个字节,在UTF-8/unicode 编码中一般占用 3 个字节(或4个字节)。在Python中,提供了len()函数计算字符串的长度,语法格式如下:
len(string)
其中,string 用于指定要进行长度统计的字符串。示例代码如下:
str = "我爱学习" length = len(str) print(length) #输出 4
从上面的结果中可以看出,在默认的情况下,通过len()函数计算字符串的长度时,不区分英文、数字和汉字,所有字符都按一个字符计算。
在实际开发时,有时需要获取字符串实际所占的字节数,即如果采用 UTF-8 编码,汉字占3个字节,采用 GBK 或者 GB2312 时,汉字占2个字节。这时,可以通过使用encode()方法进行编码后再进行获取。例如,如果要获取采用 UTF-8 编码的字符串的长度,可以使用下面的代码:
str = "我爱学习" length = len(str.encode()) print(length) #输出 12
如果要获取采用 GBK 编码的字符串的长度,可以使用下面的代码。
str = "我爱学习" length = len(str.encode('gbk')) print(length) #输出 8
3、截取字符串
由于字符串也属于序列,所以要截取字符串,可以采用切片方法实现。字符串的索引同序列的索引是一样的,也是从0开始,并且每个字符占一个位置,通过切片方法截取字符串的语法格式如下:
本文未完全显示,开通会员查看全文......