
在人工智能与基础科学深度融合的时代背景下,材料科学领域正迎来一场AI浪潮!记者今日从东莞松山湖科学城获悉,中国科学院东莞材料科学与技术研究所(以下简称“东莞材料所”)本月正式发布MatChat 2.0,这是国内首个专注于材料科学领域的AI智能体全新升级版。相较于前代产品,MatChat 2.0基于80万篇权威学术论文构建,更以1.3%的超低幻觉率大幅优于多款主流大模型,在推理能力、场景覆盖等核心维度均实现了显著提升,为广大科研工作者在材料科学研究方面打造了全新的智能研究范式。
80万篇论文积累四大核心升级
作为材料科学领域的专业AI智能体,MatChat 2.0的知识库实现跨越式扩容,从原有28万篇学术论文拓展至80万篇以上,知识储量增长近三倍。涵盖材料科学的各个分支领域,包括但不限于新能源材料、电子信息材料、结构材料、生物医用材料等,内容均来源于权威学术期刊与会议论文,经过严格筛选与质量把控,确保信息的可靠性与前沿性。
除知识库外,MatChat 2.0在响应效率、领域理解、应用场景三大维度同步实现核心升级。响应效率方面,引入全新的动态路由算法与知识检索优化技术,平均响应时间压缩至秒级,实现即时文献调研支持;在领域理解方面,系统采用四层协同架构,智能上下文持久层支持十余轮持续深度对话,意图分类与路由层精准识别用户需求,有效过滤无效信息干扰,智能体推理与执行层兼顾深度思考与快速响应两种模式,学术知识数据库引擎整合近百万量级的权威文献资源,共同保障复杂研究场景下的连贯交互体验与专业理解。 应用场景方面,覆盖材料合成与制备、性能表征与测试、学术论文撰写、项目申报等多个环节,可为科研工作提供专业、智能、可靠的支持服务。
1.3%幻觉率重新定义学术AI信标
长期以来,大模型的“幻觉”问题始终是制约其在学术领域深入应用的核心障碍。AI生成看似合理但实际并不存在的论文引用,可能导致研究结论出现偏差,甚至危及科研人员的学术声誉。传统通用大模型在专业领域的幻觉率通常高达10%以上,这一比例显然难以满足科学研究对严谨性的要求。
MatChat 2.0在这方面取得了突破性进展。MatChat 2.0的幻觉率仅为1.3%,大幅领先于GPT-4.1(5.6%)、DeepSeek-V3(6.1%)、Llama-3.3(4.1%)以及Grok-3(5.8%)等主流大模型(数据来源:Vectara Hallucination Leaderboard)。
这一成果的实现依赖于MatChat 2.0独特的三级可信保障机制。第一道防线是源头锚定,系统严格遵循“检索结果中未出现的信息绝对不生成”这一核心原则,从根源上消除了虚构信息的产生土壤;同时配备空值检测功能,当检索结果为空时会明确告知用户知识边界。第二道防线是来源绑定,每一个结论都精确关联到原始文献的具体段落,用户可通过DOI链接一键直达原文进行验证,实现“所言有所据,所据即原文”。第三道防线是过程透明,AI的完整推理过程向用户完全开放,从问题分解到信息检索,从知识整合到结论生成的每一步都可追溯、可检查。
东莞材料所战略部署AI+Science
MatChat 2.0由东莞材料所主导发布,是其“AI+Science”战略部署的重要一环。作为粤港澳大湾区重要的材料科学创新高地,东莞材料所聚焦信息材料、能源材料、功能陶瓷、先进金属等领域研究,正加快抢占新材料领域科技制高点。
当前全球科技竞争加速向“AI+科学”赛道演进,其中全球“AI+材料”领域已形成国家战略与市场创新双轮并行的竞争格局,抢占科技制高点的态势日趋激烈。在此背景下,东莞材料所立足国家战略需求,面向全球竞争格局,前瞻性布局“AI+材料”全链条创新体系。目前已构建涵盖Atomly材料科学数据库、GPTFF人工智能力场、MatChat AI智能体等核心应用平台,以及机器人科学家、科学数据开放平台、智库智能体等系列数字化工具,初步形成材料科学智能研究的一体化闭环机制。通过平台共享与工具开源,创新体系正广泛赋能全国范围内的科研机构与产业用户,有效服务国家创新需求,为应对全球科技竞争打下坚实基础。
未来东莞材料所将持续深耕,力争构建我国自主可控的“AI+材料”创新生态,形成全链条自主可控、产学研用深度融合、开放高效协同的新格局。目前科研人员可通过MatChat体验官网(https://matchat.cn/),轻松体验这一智能工具。
文、图/广州日报新花城记者:马骏 通讯员:曾园英、材数智
广州日报新花城
【来源:广州日报】
睿迎网配资提示:文章来自网络,不代表本站观点。