基于大模型特定垂直领域
术语解析的技术笔记

Exploring LLM-based Terminology Parsing in Vertical Domains (Life Sciences & Medicine)

研究背景概览

摘要: 本项目旨在探索国产大语言模型(如Qwen, GLM等)在特定垂直领域(生命科学与医学英语)中的术语解析能力。通过构建自动化解析流程,实现对复杂医学术语的精准提取、翻译及上下文语义分析,为跨语言医学研究提供技术支持。

随着大语言模型(LLM)技术的飞速发展,其在通用领域的表现已令人瞩目。然而,在高度专业化的垂直领域,尤其是涉及复杂术语体系的生命科学与医学领域,LLM的性能仍面临挑战。目前正在整理 Surgimeds(外科与医药)相关的英语词料库。由于垂直领域术语的特殊性,通用模型往往会出现幻觉(Hallucination),计划通过 LoRA 微调来改善这一问题。本技术博客记录了我作为一名研究者,在此领域进行的技术探索与编程实践。


最新技术笔记