项目
已有资源:
- 基于开源的transE算法 https://github.com/wuxiyu/transE
- 使用开源的数据集 http://openkg.cn/dataset/
工作流程:
1.1 算法读取train文件:
1.2 算法读取实体-id对应文件(压缩计算量)
1.3 算法读取关系-id对应文件(压缩计算量)
2 算法执行计算输出结果文件
实体:[向量]
3 输入两个实体 返回结果
读取实体向量结果文件
计算余弦距离或者欧氏距离
任务执行
执行fixFileForm.py预处理数据 核心参数
源文件地址
fname = “baike_triples.txt”
文件读取的行数
fnum = 10000
测试时用的10000 太小 需要用大量数据进行计算执行transE.py 算法执行 得到实体向量
- 执行calRelation 输入任意两个 输出实体的余弦相似度
THANKS
======
- Paper (Bordes et al. 2013)
- Relation_Extraction by Mrlyk423
- code by wuxiyu