Introduction

基于知识图谱和neo4j图数据库的电影知识问答系统

image-20231212102658908 image-20231212102738360 image-20231212103113278

Workflow

DataBase

爬取豆瓣TOP1000电影信息数据

Frontend

  1. 获取用户输入的信息 (语音输入 / 文本输入)
  2. 向电影知识问答后端服务器发送请求
  3. 获取返回结果 (成功 -> 4 / 失败 -> 5)
  4. 如果返回结果包含image信息,则显示图片和文字,否则只显示文字
  5. 请求基于gpt的AI模型服务器,并显示返回结果

Backend

​ [准备工作] 训练 TF-IDF 向量算法和朴素贝叶斯分类器,用于预测用户文本所属的问题类别

  1. 接受前端请求,获取用户输入信息
  2. 使用分词库解析用户输入的文本词性,提取关键词
  3. 根据贝叶斯分类器,分类出用户文本的问题类型
  4. 结合关键词与问题类别,在 Neo4j 中查询问题的答案
  5. 返回查询结果 (若问题类型为 演员信息 / 电影介绍,则附加图片url)

WorkFlow Graph

workflow graph

Frame

DataBase

Neo4j

Frontend

wechat mini programs

Backend

Python Flask Scikit-learn Jieba

Reference

Frontend

微信小程序:微信聊天机器人

BackEnd

基于知识图谱的电影知识问答系统

电影知识库问答机器人