从AI作画到ChatGPT,浅谈AI行业发展样稿
潘铭2023-04-23

2022年8月,Stable Diffusion横空出世,让人感受到AI作画的魅力,使用者如同魔法师般,只需要输入几个关键词“咒语”,即可制作出符合不同的画作,这如同炼金术般的技艺,撩动所有艺术工作者的心弦。而2023年2月,ChatGPT仅两个月就达到了上亿用户量,为公司OpenAI获得了微软的100亿美元投资,更是轰动资本圈。那么到底什么是AI呢?

AI(Artificial Intelligence),中文翻译为人工智能,可以对人的意识、思维的信息过程的模拟,通过重复对人类数据的学习,达到代替部分人类工作的目的。AI可以被用于经济政治决策、控制系统、仿真系统、内容创新、医疗诊断等各种情景生态中。

一、 AI技术发展的基础

AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术,为保证AI快速发展需要具备硬件、算法和数据三方面的支持。其中硬件为AI提供强大的数据传输和计算能力,算法为AI保证合理且符合人类行为的学习、反馈方式,数据为AI提供学习样本。

(一) 硬件——AI技术角逐的入场券

AI技术需要处理和学习大量的数据,对硬件具有极高的算力要求,而超算中心或者大型数据中心是AI模型训练与产品运营核心基础设施。以ChatGPT为例,核心基建主要是微软投资10亿美元建设的Azuer AI超算平台,包括28.5万颗CPU和1万颗GPU等产品,算力相当于全球前五大超算水平。数据中心和超算需要IT硬件和基础设施提供支持,其中IT硬件包括计算设备(主要为服务器、芯片等)和通信设备(主要为交换机、路由器等网络设备和光模块),构成了数据中心算力基础;基础设施包括电力设备、监控设备、温控系统、发电机组等,为数据中心提供了稳定的运行环境。

算力心脏——AI芯片。AI芯片主要包括图形处理器(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、神经拟态芯片(NPU)等,其中GPU占据90%以上的市场。

搭载芯片的框架——AI服务器。与通用服务器采用串行架构、以CPU为算力提供者不同的是,AI服务器采取异构架构,目前广泛使用的是CPU+GPU,拥有更出色的高性能计算能力。随着算力的持续增长,自然语言处理和图像、视频等AI模型的深入发展,AI服务器将被更广泛使用。

(二) 算法——AI的技术路线

AI的算法代表着AI的技术路线,影响AI如何利用算力,如何分析学习数据。AI算法多种多样,例如Stable Diffusion基于DMs( Diffusion Models扩散模型),而ChatGBT则是基于的谷歌的Transformer模型的NLP(Natural language processing自然语言识别)模型。

AI算法会涉及深度学习。简单来讲,深度学习就是让AI根据算法自己去发掘数据的特征和关联性,以便AI能够在不需要人工的情况下对数据进行学习。ChatGPT在深度学习的过程中,又加入了RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习),通过人工对模型结果进行调节,帮助AI辨别真实性、无害性和有用性,进一步提升了AI计算效率。

(三) 数据——AI的参考书

数据指AI学习的基础,会直接影响着AI的训练结果。数据样本需要保证质量和数量,质量保证数据准确清晰;而数量保证有足够的样本量让AI参考。

为保证数据的质量,往往需要数据清洗,检查数据一致性,处理无效值和缺失值等,确保数据的准确性和完整性,从而帮助AI学习事倍功半。

数量则会直接影响AI模型的参数数量,结果的计算和生成。目前,从事AI研究的企业往往不是龙头企业,就是背后有龙头企业合作,数据资源是其重要原因。

二、 全球AI发展的现状

(一) 国外AI发展案例

目前,国外AI项目主要由发达国家发起和研究,美国处于绝对的领先地位。美国完善的金融系统能够为AI项目提供稳定资金,优质的计算机教育保证算法创新,庞大的数据量支撑AI数据。因此,目前主流的爆款AI应用都诞生于美国。本文将以微软在ChatGPT上的布局,Google在AI上的发展为例,分析各自特点和战略。

微软。ChatGPT的公司为OpenAI,2016年由马斯克等多名科技领袖联合创办。2019年微软曾注资OpenAI 10亿美元,经多家媒体报道微软将再次注资100亿美元支持OpenAI的发展。2018年推出的GPT-1仅1.2个参数,而2019年GPT-2达到了15亿,微软注资10亿后的GPT-3则达到了夸张的1750亿,GPT的算法模型也从开源转变为闭源。微软提供的资金、超级计算机以及庞大的数据量为ChatGPT的发展提供了全方面的支撑。2023年2月8日,微软正式将ChatGPT引入Bing搜索引擎。由于现在的ChatGPT训练的数据截止至2021年,而搜索引擎又最擅长新闻类的搜索,通过ChatGPT和Bing的结合,可以有效分工,完善搜索结果,最终对搜索引擎市场进行冲击。另一方面,ChatGPT与Office有着巨大的合作潜能,将进一步帮助微软巩固办公软件市场;OpenAI旗下的图像生成系统DALL-E也能够帮助微软Designer冲击Adobe的图像编辑处理市场。

谷歌。谷歌是真正的AI龙头,在算法、硬件优化、应用等层面都有涉足。算法方面,谷歌注重开发和融合。例如GPT本身就是基于谷歌的Transformer算法,Transformer算法在语言、图像、视频和语音等方向取得了巨大的成就。除Transformer等单模态模型外,谷歌也开始注意大规模多模态的潜力,这些模型可以接收多种输入模态(语言、文字、图像、视频等)。硬件方面,谷歌着力机器学习(Machine Learning)的优化。谷歌积极推动ML加速器的开发和应用,提升每个芯片的性能和应用;优化ML编译和工作负载,能在不改变硬件的情况下获得5-15%的负载提升。应用方面,谷歌注重将AI应用到医疗、天气预测、网络安全、自动化空间设计、翻译、自然语言呈现等各方面。谷歌的AlphaGO应用于围棋和游戏挑战上,LaMDA应用于智能对话中,DeepConsensus支持尖端信息学的仪器中, ML模型用于新材料发现等等。相比微软,谷歌的AI研发和应用更加全面化,反而较少地将AI用于搜索引擎和安卓等主营业务中。

(二) 国内AI案例

相比国外,国内的企业更加注重AI在宏观活动以及基建上的运用,例如医疗、智慧城市、教育、交通等。科大讯飞在保持自身智能语音的优势的情况下,加强了对教育和医疗等方面的应用开拓。百度则一直深耕无人驾驶和智慧工业的应用。

科大讯飞。科大讯飞最知名的人工智能产品就是语音识别系统,占中国市场的60%左右,其语音识别系统相关产品包括翻译机、语音转文字系统、视频自动生成字幕系统、录音笔等。智能教育领域是目前科大讯飞收入占比最高的领域,2021年占总收入的30%以上,主要为因材施教教学方案、智能教育设备、精准教学考试以及学习机等。此外,科大讯飞将AI应用于智慧健康领域。2017年,基于科大讯飞人工智能核心技术能力的医考机器人通过了国家执业医师资格考试笔试,这是全球唯一一个通过的人工智能系统。

百度。百度于2010年开始布局AI,国内最早的公司之一,主要AI产品为Apollo自动驾驶以及工业智能化。Apollo平台拥有一套完整的软硬件和服务系统,包括车辆平台、硬件平台、软件平台、云端数据服务等四大部分。2022年8月,武汉率先发布自动驾驶无人商业化试点政策,百度获得相关运营资格,截止至2023年2月28日,武汉的无人车队已经突破百辆。工业AI化方面,百度与常州制造企业精研科技共同打造的智能质检设备解决了依靠“肉眼+放大镜”的痛点,将漏检率控制在0.1%。除以上方向,百度还在如气象监控等方向也有涉猎。

(三) AI行业发展现状分析

应用方向方面,主要可归为以下几类:1.将AI用于自身主营业务的革新,如微软将GPT用于Office和Bing;2.将AI用于提升生活质量,如科大讯飞的智能医疗、百度的无人驾驶和智能家居服务等;3.将AI用于宏观活动监测和公共政策,如谷歌的气象监测;4.将AI用于提升行业生产力,如百度的工业AI化、Stable Diffusion等。

发展方式方面,美国的开源环境成熟,因此AI项目在开源、闭源皆有优质项目。开源方面,Stable Difussion通过开源的独特优势,从用户获得大量数据从而完成机械学习,谷歌的TensorFlow则通过开源保持行业影响力。闭源方面,谷歌的LamDa、AlphaGO等都取得了一定的影响和成绩,而ChatGPT则是获得微软投资后从开源转变为闭源。另一方面,中国整体开源环境较差,由于AI需要大量数据支撑,因此目前中国AI项目主要由龙头企业发起和运营。

产品成熟度方面,虽然中美有不少AI产品,但仍还有不少问题。例如,Bing搭载ChatGPT后出现带有攻击性的回答,谷歌Bart出现逻辑错误,百度的无人驾驶仍处于试验阶段等。

三、 AI技术带来的革新和挑战

(一) AI技术带来的革新

全面推动生产智能化。AI技术可以辅助进行作画、空间布局、城市规划、工业生产等,甚至能够对代码进行撰写和革新;能够24小时无间断的创作,拥有远高于人类的产能;能够通过数据分析和深度学习过程中,发掘新规律和特征;能够模拟展示生物神经系统等寻常技术难以展示的生态;能够通过分析数据和历史政策,进行政策推演;能够通过智能化工厂改造,提升整体生产力,降低产品的不良率等。

全面推动生活智慧化。智能家居让用户能够通过语音开关空调、电灯、电视、电饭锅等,避免了移动、操作、找遥控器等麻烦,大大提升了用户的生活质量。智慧医疗能够监控用户的生理特征,及时通报异常情况,提醒用户防范疾病,甚至可能避免用户死亡。无人驾驶技术能够让车主解放双手,在驾驶过程中也能够休息、娱乐,避免疲劳驾驶。

工作人员技术力革新。通过AI技术,一个技术人员可以完成之前十几,甚至成百上千技术人员完成的工作,大大降低了人工成本。对于技术人员来说,也从技术操作转变为操作AI、监管AI,大大降低了工作岗位的技术门槛。特别对于某些技术要求高,人才紧缺的岗位,AI能够有效填补人才缺口。AI还可以替代部分风险较高的工作,有效避免技术人员的伤亡,减少操作不当导致的财产损失。

(二) AI技术带来的挑战

AI技术成熟化仍需全方面提升。硬件方面,现有的GPU、TPU以及AI加速卡仍难以支撑完全商业化后迅速增加庞大访问量和计算量。目前,Intel等公司正寻求将硅基光电应用到数据中心传输和卷积神经网络,全面提升AI的数据传输和运算能力。算法方面,深度学习+人工调整是目前主流方法,如何摆脱人工调整,提升整体学习速度,将是未来算法提升的重要方向之一。数据方面,谷歌发现当AI学习数据量达到一定程度后,增加数据量准确性提升效果甚微,如何突破该困境仍需持续研究。

需要法律条规的完善。2023年Stable Diffusion因参考数据中含有大量未经授权的画作,被三名艺术创作者共同起诉;同时Stable Difussion产出的画作,是否具有著作权保护,著作权归属使用者,还是Stable Diffusion公司的问题也需要探索。无人驾驶方向,法律风险则更加严重,无人驾驶的保险如何设计处理,事故后的相关责任界定等问题,也亟待法律、AI公司、保险等多方共同解决。由于完全没有可参考案例,国家制定法律部门如何在不损害AI技术发展积极性的情况下,制定符合行业发展的法律条规也将是今后需要探讨的重要方向。

可能导致失业,引起社会动荡。AI能够适应大量套路型、模板化工作,让社会生产力呈指数级提升,但带来的冲击和赢家通吃市场,会使很多失业者和失败者被取代、被排斥和被抛弃,可能成为解构社会、破坏秩序稳定的重要因素。政府一方面需要针对性落实反垄断法,强化监管,创造公平的竞争环境;改革税收体制,扩大社会支出,缩小收入差距。另一方面,需要建立相应的培训制度,提高劳动技能与技术发展之间的匹配度,帮助传统工人转化为AI操作人员。



转载声明:本平台转载的所有网站、公众号等内容仅用作样稿,并不用于任何商业用途,如果来源方对此有意见可联系本平台删除。

微信扫一扫

投稿征稿更方便

返回顶部
普通需求

小量征稿 7天内

长期需求

批量征稿 15天起