第2.1题:Python统计日记最重要的词
题目来自:Python 练习册。题目2.1: 你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
参考代码
1 | #coding: utf-8 |
出现的错误
编码问题
UnicodeDecodeError: ‘gbk’ codec can’t decode byte…
两种解决方法:
- decode(‘utf-8’)重新编码一下
1
2
3fp = open(filename,'rb')
content = fp.read().decode('utf-8') - open方法指定参数encoding=’UTF-8’:但是得注意一下,原文到底是不是UTF-8编码。反正Python编码这里是个大坑,多加小心。
1
content= open('filename', mode='rb', encoding='UTF-8')
文件名、目录名或卷标语法不正确
Path里边的斜杠是 / 不是 \PATH = 'E:/Python/pydata-book-master/ch02'
AttributeError: ‘list’ object has no attribute ‘…
看看那个object到底是什么,print(type(name))
,然后再查查其对应的函数。
第2.1题:Python统计日记最重要的词