资源简介:
TSpec-LLM是由加泰罗尼亚电信技术中心等机构创建的开放源代码数据集,涵盖了从1999年至2023年的所有3GPP规范文档,总计13.5GB,包含30,137个文档和5.35亿词。该数据集旨在通过保留原始文档的结构和内容,为大型语言模型(LLMs)在电信领域的理解和应用提供全面支持。TSpec-LLM特别适用于通过检索增强生成(RAG)框架来提升LLMs在处理复杂电信标准相关问题的能力,从而帮助工程师和研究人员更有效地理解和利用3GPP技术规范。
原始地址:
https://huggingface.co/datasets/rasoul-nikbakht/TSpec-LLM