加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS

您的位置:首页 > 社会 > 文化事业 > 文化服务 文化服务

扫码关注

人工智能和数字文化产业的融合创新报告

作者:杜嘉 来源:《深圳全民阅读发展报告2024》 责任编辑:Gangan 2024-10-28 人已围观

2023年,ChatGPT(人工智能聊天机器人程序)热潮从天而降。在这波AI(人工智能)技术的爆发中,ChatGPT应运而生。AI大模型能力,成了全球云厂商追捧的焦点,也成了未来云业务最核心的竞争优势之一。
 
4月11日的2023阿里云峰会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇宣布,阿里巴巴所有产品未来都将接入大模型,全面升级。
 
然而,ChatGPT发布短短几个月,各行各业都感觉到呼啸而来的AIGC正在引领着新一轮的科技革命。因为AIGC是通过巨量的数据训练学习,进而产生用户所需的内容,因此它不可避免地引发人们对于其中诸多问题的关注与探讨。
 
同时,随着科技的不断进步和人们对个性化、智能化产品的需求增加,人工智能技术正日益渗透到文化领域,为其带来了新的机遇和挑战。
 
一、AI逐步向AGI(通用人工智能)发展,高质量数据告急
 
近年来人工智能技术快速发展,随着ChatGPT通过图灵测试,以及GPT-4的问世,人工智能逐步呈现向AGI发展的趋势。GPT-4已达到理解图像、人类专业和学术基准水平,据OpenAI(美国开放人工智能研究中心)称,在公司内部的对抗性、真实性评估中,GPT-4的得分比GPT3.5高40%。
 
此外,OpenAI公布了GPT-4多项专业考试的模拟考试结果:
 
(1)GPT-4在统一律师考试中取得了前10%的成绩,而ChatGPT获得了倒数10%;
 
(2)LSAT(美国法学院入学考试)满分180分,GPT-4考163分,超过88%的考生,GPT-3.5阶段超过40%;
 
(3)SAT(美国学术能力评估考试)循证阅读与写作满分800分,GPT-4考710分,超过93%的考生,GPT-3.5阶段能超过87%。
 
“OpenAI一直以来努力的方向都是寻求更多的优质数据,深度解析已有的数据,从而使自己的能力越来越强大。”7月12日,复旦大学教授、上海市数据科学重点实验室主任肖仰华对澎湃科技表示,“获取大规模、高质量、多样性的数据,并深入解析这些数据,可能是推动大模型发展的重要思路之一”。
 
然而,高质量数据正在告急。
 
人工智能研究人员小组Epoch在2022年11月进行的一项研究显示,机器学习数据集可能会在2026年前耗尽所有“高质量语言数据”。而这项研究发布时,全球范围内的大模型潮还没有出现。根据该研究,“高质量”集中的语言数据来自“书籍、新闻文章、科学论文、维基百科和过滤的网络内容”。
 
与此同时,OpenAI等生成式AI开发机构为训练大型语言模型而进行的数据收集行为也越来越受争议。6月底,OpenAI遭集体诉讼,被指窃取“大量个人数据”来训练ChatGPT。包括Reddit(红迪网)和Twitter(推特)在内的社交媒体对其平台数据被随意使用表示不满,7月1日,马斯克以此理由对推特的阅读条数实行了临时限制。
 
7月12日,罗素在接受科技财经媒体Insider的采访时表示,许多报道虽然未经证实,但都详细说明了OpenAI从私人来源购买了文本数据集。虽然这种购买有各种可能的解释,但“自然的推论是没有足够的高质量公共数据。”
 
 1/3    1 2 3 下一页 尾页

很赞哦! ( )

评论

0

搜一搜