您现在的位置是: 网站首页 >Python Python

提取英文文章中的所有单词并转换为小写单词

admin2018年11月8日 17:13 Python | 文件 1298人已围观

1. 段落分割成字符串 1. 转换为小写 1. 替换非英文字符串 1. 字符串不为空加入列表 ```python import re """ 有一篇很长的英文文章 需求:将所有的单词变为小写,且只保留单词(a-z 26个字母),数字或标点都不要,最终所有的单词保存起来 """ with open('text.txt', 'r') as file: for line in file: # 逐行读取 line_char = [re.sub('[^a-z]', '', x.lower()) for x in line.split() if re.sub('[^a-z]', '', x.lower()).strip()] print(line_char) if '' in line_char: print('有空字符串') break ``` 一行代码出结果。。。**没有关闭文件** ```python # 一行代码出结果 all_char = [re.sub('[^a-z]', '', x.lower()) for x in open('text.txt', 'r').read().split() if re.sub('[^a-z]', '', x.lower()).strip()] print(all_char) ```

很赞哦! (0)

文章交流

  • emoji
0人参与,0条评论

当前用户

未登录,点击   登录

站点信息

  • 建站时间:网站已运行2285天
  • 系统信息:Linux
  • 后台程序:Python: 3.8.10
  • 网站框架:Django: 3.2.6
  • 文章统计:257 篇
  • 文章评论:63 条
  • 腾讯分析网站概况-腾讯分析
  • 百度统计网站概况-百度统计
  • 公众号:微信扫描二维码,关注我们
  • QQ群:QQ加群,下载网站的学习源码
返回
顶部
标题 换行 登录
网站