中国材料研究学会

会员登录 会员注册

关注

关注今日新材料

Concise Review I 孙志梅团队:材料科学中的知识引导型大语言模型
发布时间: 2025年12月31日
来源: 中国材料研究学会

中文摘要:
随着 ChatGPT 在全球范围内掀起一场变革性应用浪潮,大语言模型(LLMs)的出现彻底改变了科学研究的范式,使科研从以数据驱动为主转向以人工智能驱动的科学。尽管 LLMs 已在众多科学领域展现出巨大潜力,但面向材料科学、由材料知识引导的领域专用大语言模型的开发仍面临诸多挑战。本文综述了 LLMs 发展的关键里程碑,并提出了构建 LLMs 的指导原则,包括研究目标的确定、模型架构设计、数据整理以及训练与评估框架的建立。此外,探讨了通过微调、检索增强生成(RAG)、提示工程和 AI 智能体等方法构建领域专用模型的策略。同时,系统总结了 LLMs 在材料科学中的应用,从结构化信息提取、材料性能预测到自主实验室与机器人系统。最后,讨论了资源需求、数据集质量、基准评测、幻觉抑制和 AI 安全等挑战,并展望了相关机遇,强调 LLMs 作为推动材料发现与创新的重要工具的潜力。

 

Fig. 1. A timeline of large language models in recent years. The open-source LLMs are marked as yellow color.

yes文章核心亮点

1. 系统阐述了材料科学领域大语言模型的发展轨迹
文章回顾了大语言模型(LLMs)从通用工具逐步扩展到科学研究新范式的过程,强调其从“数据驱动”到“AI 驱动”科学的转变对科研范式的深远影响。

2. 提出材料领域知识引导型 LLM 的构建指导方案
针对领域专用 LLM 的开发难点,文章总结了一整套构建策略与建议,包括:

  • 明确目标和任务场景

  • 模型架构设计

  • 材料科学领域数据的收集与整理

  • 训练框架与评估体系设计
    这是为未来材料领域 LLM 研发提供“路线图级别”的参考。

3. 探讨了多种提升领域适应性的技术方法
文章不仅介绍了基本的 fine-tuning(微调),还重点讨论了提升模型知识能力与可靠性的重要技术,如:

  • 检索增强生成(RAG)策略

  • 提示工程(Prompt Engineering)

  • AI 智能体(AI Agents)等高级组合方法
    这些方法可以帮助模型更好地处理专业知识问题。

4. 全面总结了材料科学中 LLM 的多种应用场景
文章讨论了 LLM 在材料科学研究中的潜力应用,覆盖从基础信息提取到性能预测、从自动实验室控制到材料机器人等方向,为读者展示了 LLM 的“全景应用图”。

5. 真实指出存在的主要挑战与发展机遇
不仅强调了 LLM 在材料学中的广阔前景,还提出了现实面临的挑战,比如:

  • 模型训练和运行的资源消耗巨大

  • 高质量领域数据集稀缺

  • 评价基准体系缺乏

  • 幻觉(hallucination)问题与安全性等
    并据此提出未来研究方向和机会。