问题描述
我是SO的新手,在以下查询的python脚本编码中需要帮助。
我有一个带注释的CSV文件,也有一个带分数的CSV文件(包含每个单词的分数)。 我需要通过解析分数csv文件来找到该注释中所有单词的分数,并获得添加的分数结果输出,如下所示
评论:
sno username comment
1 lil i like @dff burger
2 cdd i hate those hamburger
....
评分:
sno word score
1 like 2
2 hate -2
3 burger 1
....
所需的输出:
sno comment addscore
1 i like @dff burger 3
2 i hate those hamburger -2
...........
我的代码:
import csv
with open('comment.csv', 'rb') as csvfile:
reader = csv.reader(csvfile)
with open('score.csv', 'rb') as csvfile:
reader1 = csv.reader(csvfile)
for word in reader1:
if word in reader:
## i stuck with logic here##
请帮助我的代码
1楼
这将使您入门,有点麻烦,使用输出执行所需的操作,将其写入csv或其他任何内容。 为了方便起见,我在这里使用熊猫,不过您不必这样做。
import pandas as pd
df_comment = pd.read_csv('comment.csv')
df_score = pd.read_csv('score.csv')
cnt = 0
for i in df_comment['comment']:
kp = []
for j in i.split(' '):
if j in [k for k in df_score['word']]:
pos = [x for x, y in enumerate(df_score['word']) if y==j]
kp.append(df_score['score'][pos[0]])
cnt= cnt+1
print cnt, i, sum(kp)
希望能帮助到你。