Jquery中文网 www.jquerycn.cn
Jquery中文网 >  Python编程  >  Python入门  >  正文 python3如何提取汉字

python3如何提取汉字

发布时间:2021-05-19   编辑:www.jquerycn.cn
jquery中文网为您提供python3如何提取汉字等资源,欢迎您收藏本站,我们将为您提供最新的python3如何提取汉字资源

采用正则表达式的方法对字符串进行处理。

str1 = "{我%$是,《速$@.度\发》中 /国、人"

相关推荐:《Python教程》

(1)提取汉字

汉字的范围为”\u4e00-\u9fa5“,这个是用Unicode表示的。

import re
res1 = ''.join(re.findall('[\u4e00-\u9fa5]',str1))
print(res1)

输出为:

‘我是速度发中国人’

(2)去除所有符号。采用清理数据,仅保留字母、数字、中文的方法。

import re
res1 = re.sub("[^a-zA-Z0-9\u4e00-\u9fa5]", '', str1) 
print(res1)

输出为:

‘我是速度发中国人’

您可能感兴趣的文章:
python3如何提取汉字
Python3 数字(Number)
Python3 OS 文件/目录方法
Python3 字典 setdefault() 方法
Python3 实例
php截取中文字符串乱码如何解决呢
vbs 汉字转拼音的函数(代码)
php判断字符串是纯英文、纯汉字或汉英混合的实现代码
Python3 File read() 方法
Python3 lstrip()方法

[关闭]