关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

首个种业大语言模型“丰登”发布

2024.4.28

4月28日,中国农业大学生物学院教授王喜庆团队联合上海人工智能实验室、崖州湾国家实验室发布首个种业大语言模型“丰登”(SeedLLM)。

1714318646430131.jpg


种业大语言模型“丰登”。中国农业大学供图

“丰登”集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,通过深入学习我国迄今发布的科研文献、科技书籍、种企报告和历史推广数据,以用户友好的互动方式,可解答有关作物品种选育推广、栽培技术以及种业企业状况等问题。“丰登”大模型技术的运用不仅填补了我国在种业专业领域的大模型空白,同时也是对我国育种领域采纳新技术的一次大胆尝试。

相较于国内外其他大语言模型,“丰登”重点关注生物育种,尤其我国主要粮油作物和肉禽动物,对维护国家粮食安全有积极意义。“丰登”旨在支持用户在品种选育、农艺性状、栽培技术和推广区域四大核心领域提供准确的解释和回答。

该模型具有4大核心能力:第一,整合分散的知识资源。系统深度挖掘并结构化我国在育种领域迄今积累的包括学术文献、书籍、田间日志在内的广泛知识。

第二,跨领域知识融合。利用多学科知识图谱,整合了生物学、遗传学、气象学、土壤学等相关领域的知识,发掘这些领域之间的新联系)。

第三,高访问效率。通过自然语言对话接口降低了技术门槛,用户可以直接提出问题并迅速获得易于理解的答案。这种对话方式确保了信息的实时性和高效获取,极大提高了工作效率。

第四,知识共享与传播。不仅服务于育种专家和科研人员,也向全国的农业工作者提供必要的支持,加速了育种知识的广泛传播和应用。

1714318646463109.jpg


1714318647576252.jpg


“丰登”与Anthropic Claude3、OpenAI GPT-4对比。中国农业大学供图

为了全面评估“丰登”在育种领域的专业性能,团队组织了国际首个种业领域的标准化人工评估评测。发布了首个种业大语言模型评测标准。

基准评测共计115位参与者,包括14名国内水稻育种专家、49名育种相关专业研究生和52名本科生(大三及以上)。评测结果表明,丰登在最佳答案个数和综合分数上的表现均超出预期,综合得分是本科生的4.87倍,而且在多个评估维度上超越了国际领先水平Anthropic Claude3和OpenAI GPT-4。

据悉,“丰登1.0”大语言模型现已拥有超过200亿参数,已开放水稻相关知识的测试接口申请。首批参与测试的单位包括隆平高科、正大集团、中国科学院、中国农业科学院、上海市农业科学院、广东省农业科学院、华中农业大学、华南农业大学、复旦大学等。

 


推荐
关闭