基于大模型特定垂直领域术语解析的技术笔记

研究背景概览

摘要： 本项目旨在探索国产大语言模型（如Qwen, GLM等）在特定垂直领域（生命科学与医学英语）中的术语解析能力。通过构建自动化解析流程，实现对复杂医学术语的精准提取、翻译及上下文语义分析，为跨语言医学研究提供技术支持。

随着大语言模型（LLM）技术的飞速发展，其在通用领域的表现已令人瞩目。然而，在高度专业化的垂直领域，尤其是涉及复杂术语体系的生命科学与医学领域，LLM的性能仍面临挑战。目前正在整理 Surgimeds（外科与医药）相关的英语词料库。由于垂直领域术语的特殊性，通用模型往往会出现幻觉（Hallucination），计划通过 LoRA 微调来改善这一问题。本技术博客记录了我作为一名研究者，在此领域进行的技术探索与编程实践。

基于大模型特定垂直领域
术语解析的技术笔记

研究背景概览

最新技术笔记

国产大模型在医学术语翻译中的准确性对比：Qwen-Max vs GLM-4

构建基于LangChain的医学术语自动化解析流水线