[打印页面][关闭页面][字号:]

智慧芽大模型算法通过网信办备案

时间:2024-02-20 15:19|来源:|浏览量:

2月18日,国家互联网信息办公室公开发布第四批境内深度合成服务算法备案信息,“智慧芽文本生成大模型算法”成功通过备案,智慧芽成为业内率先获得国家网信办大模型算法备案的企业。

作为科技创新信息服务商,智慧芽为全球的科技公司、高校和科研机构、金融机构等提供大数据情报服务。基于高质量的数据和领先的算法技术优势,智慧芽已成功训练专注知识产权领域的“PatentGPT”和专注于医药领域的“PharmGPT”两款垂直领域大模型,致力于为知识产权、研发创新、生物医药等应用场景提供高效的信息检索、分析和应用体验,颠覆传统科创信息获取和服务范式,显著提升科技创新效能。

智慧芽PatentGPT和PharmGPT的成功离不开庞大的、高质量的垂直行业数据集与丰厚的AI算法技术研发沉淀。智慧芽大模型预训练数据达到了千亿级token的规模,包含了全球170个受理局的亿万专利、论文、生物序列、化学结构等。智慧芽AI算法团队在十余年间采用计算机视觉、机器学习、自然语言处理、神经网络、OCR识别、知识图谱、大模型技术等处理和分析各类数据,也为自研大模型的训练奠定了坚实基础。

针对大模型训练,智慧芽围绕数据、算法训练、测试、强化学习构筑了四大平台,采用增强式预训练的策略,基于专利和医药领域超40位专家反馈及其2万多条对比数据的强化学习,配合RAG(Retrieval-AugmentedGeneration检索增强生成)加强大模型理解能力,减少幻觉,对齐人类意图,将大模型精度提升至80%。

目前,智慧芽AI大模型技术成功应用于智慧芽各产品,已有多项AI功能上线。

编辑 辛明月

2024年2月20日

分享到:
打印此页|关闭窗口