基于专家GPT 图谱的专家与企业难题需求精准对接系统设计与实现

1. 理论基础及技术背景

目前国内外专家数据库已有较多研究。国内一些学者提出了不同的专家数据库建设方案，陈奕男等人设计了一个针对互联网专家数据信息抽取技术的专家数据库构建方法[1]。李欢等人通过对专家基础数据的获取以及遴选，提出了基于科研项目评价的专家数据库构建方法 [2]。杨高均通过数据存储技术、大数据挖掘分析技术进行专家管理、专家推荐信息系统的构建 [3]，此外，也有一些民营企业和创业公司涉足这个领域，例如“专家在线”等。在国外，类似的专家需求对接系统也在不断发展和完善。例如，美国的“Expertise Finder”、“Kolabtree”等平台，为客户提供专家服务的系统。此外，学术领域也有一些专门针对某一领域的专家需求对接系统，例如生命科学领域的“ResearchGate”等。总体来说，专家数据系统是一个新兴的领域，尚处于不断发展和探索的阶段。

目前，现有专家系统存在专家信息来源方式单一、专家基础资源少等问题。已有专家信息库系统功能集中在信息的汇总、管理与分发方面，主要满足用户查询检索功能，匹配推荐的专家构建研究仍处于新兴阶段。

2. 系统设计

2.1 模型整体架构

本文设计的基于专家 GPT 图谱的专家与企业难题需求精准对接系统由数据层、知识图谱构建层、智能匹配层、服务层、用户交互层组成。首先，从合作高校、政府单位等多源渠道收集数据，存储专家个人基本情况、专业领域、代表性研究成果、荣誉情况等。其次，在知识图谱构建层，利用先进的数据处理与知识抽取技术，构建出反映专家研究专长、难题分类关联等复杂关系的知识图谱；智能匹配层利用高效的算法在图谱中搜索，为企业难题找到最合适的专家；最后，在服务层，系统向企业推荐专家，同时通过用户交互层收集反馈，不断优化匹配效果。

2.2 系统功能设计

2.2.1 系统管理模块

负责系统的用户、角色、菜单、日志等功能。用户管理主要是对登录用户的角色、权限、个人信息进行管理。

2.2.2 人才专家模块

提供专家注册、基本信息录入界面，包括姓名、专业领域、教育和工作背景、研究成果、荣誉奖项、联系方式等。利用GPT 大语言模型，对专家信息进行深度分析和挖掘，构建专家知识图谱。同时，支持图谱动态更新和扩展，以反映专家的最新研究成果和变化。对录入的专家信息进行严格审核，确保信息的真实性和准确性。

2.2.3 企业需求发布模块

提供企业用户提交难题需求的界面，用户可描述问题的背景、现状、期望的解决方案、紧急程度等关键信息。利用自然语言处理技术对提交的难题需求进行解析，提取关键信息和特征，如问题类型、所属领域、关键词等。根据解析结果，自动为难题需求分配分类和标签，便于系统管理和用户搜索。同时，支持用户手动修改和调整分类与标签，以提高准确性。

2.2.4 匹配推荐模块

对专家类型和研究方向进行整合、分类，呈现出初步的用户画像，将企业需求方的基本信息、企业类型等数据信息储存到系统，对其进行有序整合，再将人才信息与企业动态行为数据进行关联分析，为用户提供所需信息资源，将匹配结果以列表或卡片形式展示给企业用户，提供查看专家资料、联系专家等功能，保证推送的精准性要求。

2.2.5 在线交流模块

支持企业与专家的在线交流管理，为企业和专家提供实时聊天或视频咨询功能，以便双方深入交流讨论。允许企业对专家服务进行评价、反馈，包括满意度评分、文字评价、改进建议等。系统收集并整理反馈数据，为专家服务质量提升和系统优化提供依据。

2.2.6 科技资讯模块

提供查看相关科技政策和科研成果的页面，定期发布最新的科研成果及相关政策，给企业和专家提供最新资讯。

2.3 系统角色

该系统用户主要包括专家、企业、系统管理员。

2.3.1 专家端

提供注册登录，基础信息管理、科研成果管理、在线沟通等功能。专家通过系统注册并验证身份后，可以上传自己的基本信息、成果信息和通讯信息。

2.3.2 企业端

提供注册登录，企业需求信息、在线沟通、个人中心等功能，注册登录包括注册、登录、密码找回；企业需求信息包括发布企业需求信息、查看专家信息、评价专家服务等。个人中心包括基础信息管理、在线沟通交流信息等。

2.3.3 管理端

提供系统监控、数据分析、用户管理、专家信息、需求信息维护等功能，可对系统信息进行增删改查。为防止用户对系统任意操作，业务流程需管理员审核。

3. 系统实现

3.1 采集数据

数据集来源于包括大量的 Web 文本、论文、专利、报告等，对这些数据进行预处理，包括对所获得的专家信息进行组合归类，归类同一专家的所有信息，以便将其输入GPT 模型进行训练。

3.2 专家GPT 图谱模型训练步骤

第一步：微调 GPT 模型。让该模型在对话场景初步具备理解人类的意图，从用户的prompt 集合中采样，人工标注prompt 对应的信息，然后将标注好的 prompt 和对应的信息去 Fine-tune 模型，经过微调的模型具备一定理解人类意图的能力。

第二步：训练奖励模型。让该模型评估微调模型的回答是否正确。采样用户提交的prompt，通过微调的模型生成n 个不同的答案，如A、B、C、D。人工对A、B、C、D 按照相关性、正确性等标进行综合打分。采取pair-wise 损失函数训练回报模型RM。奖励模型的损失函数：

第三步：强化学习增强微调模型。使用微调 GPT3.5 模型初始化PPO 模型，采样一批和用户提交 prompt 不同的集合，使用 PPO 模型生成答案，使用奖励模型打分。通过产生的策略梯度更新 PPO 模型。利用强化学习鼓励PPO 模型生成更符合RM 模型判别高质量的信息。

3.3 基于专家GPT 图谱模型的精准匹配

企业提出具体问题或需求时，系统可根据 GPT 图谱模型中的专家信息，匹配相的专家和知识资源，并将其推荐给企业，具体流程如图 ¹ 所示。

4. 结论

本研究通过引入专家GPT 图谱模型，在“基础大模型 + 指令微调”的创新范式下，融合了基于人类反馈的强化学习训练机制。该模型能够精准捕捉并响应企业的多样化专家信息需求，提升信息获取的速度与准确性，解决专家资源难觅、科研成果转化不畅等关键问题。

参考文献

[1] 陈奕男 . 基于 WEB 的专家数据库建立方法研究与实现 [D]. 华南理工大学 ,2017.

[2] 李欢 . 科研项目评价专家数据库搭建与优化策略 [J]. 常州信息职业技术学院学报 ,2017,16(02):28-31.

[3] 杨高均 . 基于大数据的科技专家库管理系统构建研究 [J]. 电子技术与软件工程 ,2020,(24):130-131.

作者简介：张莹，1977.12，女，汉，浙江绍兴，理学博士，教授，研究方向：运筹学与控制论。

基于专家GPT 图谱的专家与企业难题需求精准对接系统设计与实现

张莹

Related Articles

关于新时代机关党建高质量发展对策研究

基于国内媒体实践的大数据时代突发事件新闻报道研究

乡村振兴视域下文明乡风建设的实践路径

跨学科视角下，借自然现象启科学兴趣

新时代国企基层发展党员质量提升的路径探析