百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜告诉《中国科学报》,在有监督学习中,数据的标注数量和质量是模型训练的关键瓶颈;而通过一些任务的设计,大模型可以在海量的无标注数据上进行规律和知识的学习。 吴甜举例说,百度文心ERNIE大模型学习的就是互联网上海量的人类语言数据,包括文章、段落、著述等等——就像通识教育一样,这些数据本身没有被标注。...
成立以来,中科凡语面向不同的用户需求,研发出信译、信推、信析、信服和信取五大产品,以及飞译机器翻译平台、洞知智能分析平台、飞校智能审校平台三大平台化产品。 周玉介绍,飞译机器翻译平台旨在帮助有翻译需求的人群能够优质、高效、轻松地完成翻译,目前已支持80多个语种、10个专业场景的高质量多语言机器翻译。...
周明介绍,预训练模型是利用大规模语料库、通过无监督方式训练出的一个大规模的语言模型,根据上下文定义每个词的语义表达,并基于模型做下游的任务,比如说机器翻译,文本生成,问答搜索等。过去几年,预训练模型在自然语言领域得到非常广泛的重视,各大公司学校都开展了预训练模型的研究,出现了模型越大越好的趋势。“可是模型越大,训练成本越高,要求机器设备的能力也就越大,这就产生了环保和节能的问题。...
启明创投合伙人周志峰表示:“下一个十年,人工智能将走向认知智能,预训练大模型是其核心技术推动力和关键基础设施,让AI吸收更多的知识去理解和思考,最终实现接近人类水平的认知。同时,预训练大模型使得AI从依赖手工调参建模走向可大规模复制的工业化阶段。”日前,大规模预训练语言模型ChatGPT成功破圈,它可以按照要求写诗、写新闻稿甚至生成代码,使得大模型的创新热潮备受关注。...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号