您现在的位置是: 网站首页 >Python Python
提取英文文章中的所有单词并转换为小写单词
admin2018年11月8日 17:13 【Python | 文件 】 1298人已围观
1. 段落分割成字符串 1. 转换为小写 1. 替换非英文字符串 1. 字符串不为空加入列表 ```python import re """ 有一篇很长的英文文章 需求:将所有的单词变为小写,且只保留单词(a-z 26个字母),数字或标点都不要,最终所有的单词保存起来 """ with open('text.txt', 'r') as file: for line in file: # 逐行读取 line_char = [re.sub('[^a-z]', '', x.lower()) for x in line.split() if re.sub('[^a-z]', '', x.lower()).strip()] print(line_char) if '' in line_char: print('有空字符串') break ``` 一行代码出结果。。。**没有关闭文件** ```python # 一行代码出结果 all_char = [re.sub('[^a-z]', '', x.lower()) for x in open('text.txt', 'r').read().split() if re.sub('[^a-z]', '', x.lower()).strip()] print(all_char) ```
很赞哦! (0)
相关文章
文章交流
- emoji