2022年,AI发展突然加速。
原来以为,AI只会完成程序设定的机械指令。
只能在工业领域,协助人类工作。
然而,今天的AI现在却开始“忤逆人类”。
它不断地在独属于人类的领域突破。
AI真的越来越强大,也越来越需要引起关注和深思。
图片来源:文心一格
未来学家库兹韦尔曾公开表示,
在2045年左右,AI将可能达到一个奇点。
在那一刻,AI也许将正式迎来技术爆炸,人和AI的关系达到一个新的起点。
现在看来,这一时刻很可能还会提前到来。
人类却还自以为是,徘徊不前。
世界还在彼此争斗,吵个不停。
在很多人看来,AI只是一段程序。
至于像艺术这样的高维世界,独属于人类。
可是2022年的AI正在染指的领域,就包括绘画。
1
AI绘画,发展一日千里
2022年12月8日,一场拍卖会在上海举行。
拍卖的对象,是人机共创的一幅AI山水画,取名也令人深思——《未完·待续》。
它是全球首次由人类和AI共同创作并进行拍卖的山水画。
这幅画的底稿是民国才女陆小曼未完成的作品。
著名海派画家乐震文,续笔完成了先人之画意。
AI,也在这份原作上进行续画创作。
山水画,通常包含“勾”“皴”“擦”“染”“点”等基本画法。
对于一个人类画家来说,这些基本画法用手操控画笔就能实现。
但对于AI而言,它没有手,只能基于数学建模来绘画。
每一根线条、每一处构图,并非由人来完全掌控。尤其是风格、皴法要求严格的山水画,对AI创作是更大的挑战。
AI艺术与创意平台“文心一格”,成功完成了以上挑战。
不仅能够理解画面内容,而且自动扩展和优化画作内容元素。
同时,将画稿本身、AI的创造力与人类的判断力,绝妙地进行了融合。
最终,一幅尊重原画的成品得以诞生。
不仅富有创造力,也符合中国画风格。
最终,这幅全球首次AI山水画以110万元落槌成交,成功拍卖。
文心一格的惊艳表现,又是一个经典案例。
世界变了,AI绘画已经有灵魂了。
为什么会这样,到底发生了什么?
AI绘画的背后,有一个少为人知的存在。
正是它的进步,带来了AI的突飞猛进。
它就是大模型,是AI绘画重要的技术支撑。
2
AIGC时代,要来了
AI能够做的,当然不只是绘画。
AI绘画,只是AIGC(AI生成内容)的一种表现形式。
除了绘画,文字、代码、音频、三维建模等,都可能通过AI来生成。
也就是说,曾经认为只有人类能够创造的内容领域,AI已经参与进来。
从技术层面分析,AIGC主要涉及到以下两点:
1、自然语言处理(NLP):NLP是实现人与计算机之间如何通过自然语言进行交互的手段;
2、AIGC生成算法:以生成对抗网络(GAN)和扩散模型为主。
简单来说就是,NLP类似翻译的角色,是人与AI进行沟通的桥梁。
生成算法则是AI的引擎,是AI得以源源不断进行“创作”的核心动力。
算法越先进,AI越强大。
从生成对抗网络到diffusion扩散模型,AI算法一直在不断优化。
当然,对海量数据集的高效处理,也是AIGC得以迅速发展的重要原因。
这些,同样也都离不开一个重要支撑:大模型。
在不久的将来,AIGC很可能将会做到:
1、写作:写一部同《最后的问题》媲美的科幻小说;
2、聊天:与人类进行突破“图灵测试”的对话;
3、谱曲:作一首与《梁祝》不相上下的绝世音乐;
4、绘画:绘制一张超越《蒙娜丽莎》的天才画作;
5、制作电影:生成一部像《教父》般的经典电影;
6、编写程序:创建和Linux一样伟大的开源代码。
这不只是猜想和预测,AIGC已经在稳打稳扎步步为营了。
文心一格的AI绘画,Copilot的AI编程,ChatGPT的AI对话,都是案例。
3
还记得李世石那场世纪对决吗?
谈到AI,许多人应该对AlphaGo还记忆犹新。
2016年,AlphaGo与李世石展开世纪对决。
在第4局,李世石的“神之一手”,帮助其扳回一局。
人类暗自庆幸,AI没有全胜。
AlphaGo是怎么做到的?
谈到AI在大模型之前最重要的技术,那就是“深度学习”。
AlphaGo的“大脑”,是一套机器学习系统。
支撑AlphaGo的机器学习算法,是“深度学习”+“强化学习”。
AlphaGo借助两种深度神经网络:value network与policy network。
value network负责评估棋子选点,policy network则选择落点。
通过不断地强化学习,AlphaGo最终训练出了超出人类顶尖棋手的能力。
AlphaGo神经网络的训练过程和结构
后来,通过优化深度学习算法,AlphaGo又进一步升级:
1、学习数据全部来自机器自身的主动搜索,而非人类投喂;
2、由多机运行转换为单机运行,应用效率增强;
3、“自动决策”能力得到进一步提升。
前些年AI的迅猛发展,都与深度学习密切相关。
但这两年AI的挺进,是在深度学习的基础之上,强化了大模型的能力。
只是作为后台BOSS的大模型,大部分人感知不到。
4
深度学习→大模型
深度学习,是AI发展的重要突破。
它能让计算机自动学习出模式特征,减少人为设计特征的不完备性。
但是,深度学习模型也存在不足:
1、在只能提供有限数据量的应用场景下,深度学习算法不能对数据规律进行无偏差统计;
2、由于深度学习中图模型的复杂化,导致算法的时间复杂度急剧提升,为保证算法的实时性,需要更高的并行运算和更好的硬件支撑。
也就是说,深度学习虽然强大,但它需要大数据支撑,才能达到高精度与高准确度。
2022年AI突然有了质的飞跃,背后的原因,就是大模型的崛起,让深度学习如虎添翼。
对手写数字进行分类的CNN结构图
大模型的出现,很好地解决了以上问题。
大模型也称为“预训练大模型”,通过大模型,AI开发者可以直接获得相对现成的训练结果,并在此基础上直接开发AI应用。
而大模型的核心特征,就是模型参数多,训练数据量大。
当前,大模型的参数量,基本都是百亿级别以上,多则高达万亿。
相应的,大模型的泛化能力更强,可以完成多个不同的任务。
有了大模型预训练出来的各种参数和场景,AI就能在各个领域迅速突破。
也就是说,大模型在一定程度上也解决了通用性的难题。
AI开始全方位的突破,翻译、配音、绘画、搜索、写作、建模……
特别是2022年,明显能感觉到AI的“蠢蠢欲动”。
因为大模型越来越成熟,它为AI提供了子弹。
5
全球AI科技巨头的必争之地
大模型,是当前AI领域的技术新高地。
全球的AI科技巨头,都在狂炼大模型。
国内有百度、华为、阿里,国外则有谷歌、微软、英伟达……
科技巨头们在这个时候发展大模型,其实是在为将来布局。
百度文心大模型结构图
可问题来了,看起来都是大企业在布局。
AI产业领域的中小企业,如何参与进来呢?
面对人工智能这样的巨大市场,中小企业如何参与呢?
由于成本太高,小企业没办法预训练自己的大模型。
OpenAI 在训练包含1750亿参数的GPT-3时,就花了将近500万美元。
这还只是千亿级的大模型训练成本。即使是对于科技巨头来说,这样的成本也不低。
因此,如何实现大模型的经济适用性,就变得极为重要。
那么,中小企业具体该如何做呢?
一个可以考虑的方向是:让大模型与各种垂直场景需求进行有效匹配,实现落地。
也就是大厂建大模型,中小企业建立各类场景应用。
在这方面,百度的做法也许值得借鉴。
面对如何实现大模型产业化这个问题,在百度看来,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。
以文心大模型为例,它是百度自主研发的产业级知识增强大模型体系。
它既包含基础通用的大模型:
1、NLP大模型:医疗、金融、搜索、跨语言……
2、CV大模型:商品图文搜索表征学习、OCR图像表征学习……
3、跨模态大模型:文图生成、文档智能……
4、生物计算大模型:化合物表征学习、蛋白质结构预测……
同时,也包含行业大模型:能源、金融、航天、制造、传媒……,让大模型技术与真实场景需求,真正实现了有效匹配,也推动了大模型的落地。
比如前面提到的文心一格,以及最近刚刚发布的产业级搜索系统文心百中,都是文心大模型的落地应用产品。
也就是说,借助文心大模型,你也可以做出一个AI绘画,或者一个垂直版的baidu搜索。
当然,大模型还有更多可以应用的场景。
你虽然没有大模型,但可以在大模型里训练出一个小模型。
6
怎样使用文心大模型?
目前,文心大模型已经发布36个大模型。
通过飞桨开源平台、百度智能云,为工业、能源、金融、通信、媒体等各行各业提供支持。
下面是部分合作案例:
航天(中国探月与航天工程)
应用场景:航天故障部位信息抽取、航天工程文献情报分类、航天技术文献检索与摘要生成等多个航天领域应用场景。
能源(国家电网)
应用场景:设备技术标准知识库、电力知识问答系统、电力文档智能分析等多个能源行业应用场景。
金融(浦发银行)
应用场景:智能对话、智能文档分析、智能双录等多个金融行业应用场景。
汽车(吉利)
应用场景:智能客服系统、车载语音系统、领域知识库构建等汽车行业应用场景。
大模型能够做的事情,当然也不只上面这些。
比如,一个小朋友可以帮妈妈建一个应用:如何判断水果新不新鲜。
他多拍一些水果照片喂给AI程序,让AI慢慢了解什么新鲜什么不新鲜。
然后他妈妈就可以利用这个AI小程序,到外面买水果,扫一扫就能判断新鲜还是不新鲜。
简不简单,好玩不好玩?
这样的场景其实比比皆是,只是我们对大模型了解得太少。一看到大模型,就以为是个什么神奇得不得了的冰冷怪物。
其实不然,它可以成为我们的技术助理。
那么,一个企业如果有应用需求的话,该怎么具体对接文心大模型呢?
以百度文心大模型体系中的全功能AI开发平台BML为例。
BML是一个面向
它能够提供从数据处理、模型训练、模型管理到模型推理的全生命周期管理服务。
帮助用户更快地构建、训练和部署模型。
BML大致开发流程如下:
1、需求对接:企业结合自身业务实际需求,对接AI项目定制;
2、数据处理:整合源数据,自动完成数据采集、清晰、扩充、标注等任务;
3、模型建构:BML内置文心大模型开发套件, 仅需编写极少代码即可完成模型的构建与高效训练;
4、模型管理:在完成建模和训练任务后,企业可通过多种方式导入模型进行统一管理,自动完成模型的评估、优化和转化;
5、部署应用:在一次训练后,企业可采用多种部署方式,包括服务器侧部署和边端部署。
以上就是BML的大致开发流程,完整实现了一站式AI开发。
不仅模型精度高,也高效便捷。
一家小企业,只要你利用好文心大模型:
你可以做出一个垂直类的国风版AI绘画产品;
也可以做出一个家庭宠物的安全监控应用;
还可以做出一个内容只涉及元宇宙的搜索应用。
聪明的企业已经开始在这方面赚钱了。
一定要去占百度的便宜,利用好文心大模型。
7
大模型,还能做什么?
其实大模型还可以做很多事情。
拉普拉斯妖会说:给我时间,就可以计算出宇宙的未来。
当然,计算宇宙的未来,可能还是很遥远的事情。
但随着算力与算法的优化,大模型在未来也许还可以做更多。
比如下面这些:
1、预测世界杯,计算出谁是冠军;
2、预测股市,让你顺利实现抄底;
3、预测地震,提前预警避开灾难;
4、预测流行病,可提前做好预防;
5、预测癌症,提前介入进行治疗;
……
文心·NLP大模型ERNIE 3.0 Zeus
在阿西莫夫的《银河帝国》中,谢顿借助“心理史学”,预测银河帝国的未来,也改变了全人类的未来。
实际上没有什么“心理史学”,能够做到这一点的更有可能是大模型。
它会是一个超级智能系统,塑造人类生活的方方面面。
8
这些行业,都在悄悄面临挑战
关于AI,争议颇多。
有人将其视作朋友,认为AI会辅助人类进化。
有人将其视作敌人,认为AI会毁灭人类未来。
在许多经典科幻作品中,AI与人类的关系,也微妙且复杂:
《2001太空漫游》:超级智慧电脑HAL 9000为保全自身,杀死了太空船上的科学家们。
《黑客帝国》:AI占领了真实世界,将人类统治在“矩阵”之中。
《机械公敌》:AI突破了机器人三定律的限制,试图通过控制人类来保护人类。
《西部世界》:AI在人类残暴的杀戮中逐渐觉醒,开始反抗人类的统治。
《银河帝国》:机器人丹尼尔为了保护人类利益,默默守护了人类两万年。
……
在不少人看来,上面这些只是科幻而已。
AI就算发展再快,它也只是人类的奴仆。
所以,没有必要过分担心。
图片来源:文心一格
但在深度学习以及大模型的加持下,AI已经在各个领域,开始接近甚至超越人类。
当前许多行业,正在悄悄地面临来自AI的挑战:
在绘画方面,文心一格有超越人类的趋势;
在翻译方面,DeepL的精确度堪称完美;
在配音方面,Azure几乎做到了以假乱真;
在搜索方面,Metaphor比谷歌更加精准;
在工业生产方面,AI早已渗透到各个角落。
……
有了大模型后,AI可以做很多事,同时也让人类担心。
结
无人幸免,抑或文明升级?
从AI绘画,到围棋对决。
从自动驾驶,到搜索引擎。
从城市管理,到金融交易。
从航天探索,到能源供给。
类似于百度文心大模型这样的大模型,它将渗透到人类生活的每一个角落。
大模型,将可能成为全世界的超级大管家。
图片来源:文心一格
AI在2022年的超级表现,也关乎着人类的命运走向。
我们是在创造一个强大的“不可预测超级智能”。
AI的力量,一天比一天强大。
机器人三大定律,人类是否要提前思考?
今年6月,谷歌工程师Lemoine称谷歌开发的聊天AI“LaMDA”已具备“人格”,拥有自己的感受,并像人一样推理。
牛津大学和谷歌DeepMind的研究人员,也合著论文预测:AI将可能对人类构成威胁。
AI实验室FAIR的研究员Abelard甚至更激进,认为库兹韦尔说2045年左右AI将达到奇点太保守,2035年就可以达到。
留给人类的时间,只有13年了?
如果AI真的有可能到达奇点,人类将迎来怎样的命运?
然而,人们都认为这只是一个玩笑,没人去思考答案。
这似乎有点危言耸听,我们更认可苹果CEO库克的话:
我害怕的不是AI会思考,我们害怕的是人类不再思考。
文章转发自量子学派微信公众号,版权归其所有。文章内容不代表本站立场和任何投资暗示。
Copyright © 2023-2024.Company 短视频duanshipin.vip All rights reserved.短视频