问题描述
我正在关注在线教程( ),尽管编写了相同的python脚本,但我还是被卡住了。 我不太精通python,并且很难理解地图上的文档(本教程中使用过)。 现在,我收到“ valueError无法设置没有定义索引和无法转换为Series的值的框架”并且无法找出解决办法。 我的印象是该数据框将具有3列。 一种带有所有推文,一种带有提及Facebook的推文,一种带有所有提及Microsoft的推文。 我还意识到该教程已有两年历史,因此也许不赞成使用某些语法? 任何帮助表示赞赏
import json
import pandas as pd
import re
tweets_data_path = "Desktop/twit_dat/tweet1.txt"
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
tweets = pd.DataFrame()
tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
tweets['Facebook'] = tweets['text'].apply(lambda tweet: word_in_text('Facebook', tweet))
tweets['Microsoft'] = tweets['text'].apply(lambda tweet: word_in_text('Microsoft', tweet))
def word_in_text(word,text):
if text == None:
return False
word = word.lower()
text = text.lower()
match = re.search(word,text)
if match:
return True
else:
return False
这是我使用的数据示例: :
1楼
也许您的熊猫版本较低。
我复制代码并在编译器上正常工作。
看看这是否有帮助。
-更多是评论,但我没有特权-。