英文句子相似性判断
2018-03-28 21:02
309 查看
1.要求
本次项目提供一系列的英文句子对,每个句子对的两个句子,在语义上具有一定的相似性;每个句子对,获得一个在0-5之间的分值来衡量两个句子的语义相似性,打分越高说明两者的语义越相近。如:
def stacking_result(w2v_x_train, LR_x_train,PCA_x_train, w2v_x_test, LR_x_test,PCA_x_test, label): """ stacking 方法对结果的集成 :param w2v_x_train: :param LR_x_train: :param w2v_x_test: :param LR_x_test: :param label: :return: """ x_train = [[w2v_score, LR_score, PCA_score] for w2v_score, LR_score, PCA_score in zip(w2v_x_train, LR_x_train, PCA_x_train)] x_test = [[w2v_score, LR_score, PCA_score] for w2v_score, LR_score, PCA_score in zip(w2v_x_test, LR_x_test, PCA_x_test)] model = LinearRegression() model.fit(x_train, label) predicted_train = model.predict(x_train) predicted_test = model.predict(x_test) r, p = pearsonr(predicted_train, label) # 直接结果输出 print('Result stacking:raw', r) return predicted_test
View Code
结果:
Result w2v: 0.770842157582 Result LR: 0.761403048811 Result PCA : 0.728098131446 Result stacking: 0.820756499196 end...
相关文章推荐
- 判断传入的句子是中文还是英文还是中英混合并分割的函数
- ●有哲理的英文句子◎ -- 中英文对照
- 将英文句子拆成一个个单词(对于句子中可能出现的不同情况)
- 倒转英文句子
- JAVA-统计英文句子中出现次数最多的单词和出现的次数
- 常用英文句子
- 一个雷死人的英文句子
- java中判断字符串真实长度(中文2个字符,英文1个字符)的方法
- 判断字符串是不是全英文、全中文、中英混合
- 英文经典爱情句子
- [每天读一点英文:那些给我勇气的句子]:our kind landlord
- unicode下CString提取判断中文。英文字符。及数字
- 每天学习一算法系列(10)(输入一句英文句子,翻转句子中单词的顺序,但单词内字符的顺序不变,句子中单词以空格符隔开)
- python判断unicode是否是汉字,数字,英文,或者其他字符
- 使用prompt输入一句英文句子和排序方式(升/降),将所有单词按排序方式排序后在网页上输出
- java中如何判断输入的是英文还是中文
- 读入一行英文句子,将每个单词倒置后,输出这个单词倒置后的句子,空格和标点符号不做处理
- 英文句子
- 一些比较精彩的英文句子(二)
- python判断unicode是否是汉字,数字,英文,或者其他字符