首页 > 业界动态 >

拓尔思林松涛:发挥高质量数据积淀优势 打通大模型落地关键路径

时间:2023-06-08 20:08:18

21世纪经济报道记者雷晨 北京报道

6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”召开,主题为“AI领域上市公司创新涌现、技术难题与发展路径”。

会上,拓尔思(300229.SZ)副总裁林松涛介绍了“拓天”大模型及行业应用。他表示,大模型技术场景落地中的挑战,主要是质量、可控、时效和成本。


(资料图片)

质量方面,他认为,个人服务用ChatGPT,提示词不准可以换一个,如果图片生成不好也可以再换一个,可以说个人对AIGC的容忍度是很高的。但是企业不一样,给政府写顾问报告,数据来源必须是准确的。

可控层面,一是内容安全,数据是有价值观的,模型没有价值观。二是私域数据安全,中国大模型要数据化落地,如何在保证用户私有数据安全的同时将大数据较好地运用也是一个问题。

时效方面,在大数据训练上,灾难性的遗忘一直都是训练的问题,所以需要大模型解决这个问题。另外,怎样输入即时数据,类似Chat GPT,数据最新只到2021年9月,因此在To B服务的时候用不好。

成本方面,千亿模型私有化落地的时候需要训练好,在企业端落地还需要让企业用得起。拓尔思做To B服务,垂直场景落地成为“百模大战”的核心要点。

据林松涛介绍,大模型出来以后颠覆了拓尔思此前积累的NLP技术,公司发现,在大模型的基础上再去结合知识图谱、自然语言处理技术效果更好。与此同时,公司拥有长期数据采集和高质量数据资产积累优势,可将数据迅速投入到大模型当中。

“现在拓尔思拥有全网数据1500亿,有人工整理、专家整理的数据库达30多个,主题数据110亿个,这是拓尔思能够做大模型很重要的优势。”林松涛称。

据了解,拓尔思在大模型应用方面首先选择政府、媒体和金融三个优势赛道。

在林松涛看来,做垂直领域首先要选好大模型基座,国内头部厂商自己做基座,也有一些厂商选择开源,同时还需要有数据以及在专业领域的积累,最后在大模型落地时,不仅要有技术、数据、还需要让用户知道如何应用,包括真实场景的闭环、基于用户反馈的学习等等。

“我们现在要解决的三个问题,一是实现大模型与专业知识库的融合。二是如何提升AIGC的内容质量和数据安全,特别是在内容事实核查方面。三是如何降低百亿级大模型落地的成本。”林松涛表示。

关键词:
x 广告
共同抗疫!郑州71岁党员志愿者每天爬6栋楼,提醒800多户居民做核酸

1月4日,郑州市新冠肺炎疫情防控指挥部办公室发布通告对部分区域实施管控措施。这是近半年来,新冠疫情第3次造访郑州。截止至1月10日24时,

安阳疫情最新消息|1月11日8时至12日8时安阳市新增本土确诊病例39例,累计123例

安阳疫情最新消息2022年1月11日8时至12日8时安阳市新型冠状病毒肺炎疫情最新情况1月11日8时至12日8时,全市新增本土确诊病例39例(汤阴县38

迅速高效!“河南抗疫互助通道”网上网下联动 获群众点赞

核酸检测24小时了还没查到结果,怎么办?现在高速下站口的管控政策到底是什么样子的?从洛阳老城区自驾走高速回郑州,收费站还劝返吗?苏八

信阳市疫情防控工作视频调度会召开 陈志伟出席会议

1月11日,市疫情防控工作视频调度会召开。代市长陈志伟出席会议并讲话。听取有关疫情防控重点工作和各县区(管理区、开发区)疫情防控工作

全国最新疫情消息:11日新增本土确诊病例166例 天津市今日启动第二轮全员核酸检测

11日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增新冠肺炎本土确诊病例166例(河南118例,其中安阳市65例、许昌市41例、

1月12日天津市放假半天 开启第二轮全员核酸检测

1月12日,天津市人民政府发布重要通告,为做好天津市第二轮全员核酸检测工作,全市机关和企事业单位于1月12日(星期三)下午放假半天。广大

x 广告

Copyright ©  2015-2022 现在评测网版权所有  备案号:粤ICP备18023326号-5   联系邮箱:855 729 8@qq.com