如何利用 Python 编写一个简单的脚本可以将文本文件中的所有单词统计出来?
# 打开文本文件
with open("text.txt", "r") as f:
# 读取文本内容
text = f.read()
# 使用 re 模块进行匹配
matches = re.findall(r"\w+", text)
# 打印所有单词
print(matches)
解释:
-
open()
函数打开名为text.txt
的文本文件,并使用read()
方法读取文本内容。 -
re.findall()
函数使用正则表达式r"\w+"
对文本内容进行匹配,匹配所有单词。 -
print(matches)
打印所有匹配到的单词。
示例文本:
This is a sample text file.
This sentence has multiple words.
Here is another sentence.
输出:
['is', 'a', 'sample', 'text', 'file', 'sentence', 'another']
注意:
-
\w
代表任何字母、数字或下划线字符。 -
re.findall()
函数会返回所有匹配到的单词,即使单词之间没有空格。 - 如果文本中没有单词,则
matches
列表将为空。