人工智能“技术奇点”越来越近了。
近日,聊天机器人模型ChatGPT风靡全网。凭借背后强大的技术,ChatGPT可以完成流畅对答、写剧本、写代码等各项功能,目前全球已经积累超过百万的用户。它甚至可以创作诗歌和笑话,这是一种之前被认为只属于人类的能力。
OpenAI的联合创始人马斯克评价道,“好得可怕,我们离强大到危险的AI不远了。”
这并不是AIGC(AI generated content,AI技术生成内容)第一次震惊人类。时间推回到八个月以前,主业从事PPT设计的博主阿文偶然刷到一位艺术家的微博,内容包括几张十分惊艳的图片,“一开始我还以为是他自己画的,结果他说那是直接通过文字生成的,在那时的我看来这是一件不可思议的事情。”
被深深震撼的阿文投身关注起AI绘画这个领域,并在微博上做起了相关技术的推广者。短短几个月,阿文深刻感受到技术的飞速精进与完善,“4月份的时候生成的图片还是比较偏意识流的,五六月份的时候已经画得越来越像人,尤其是现在已经非常恐怖了。”
OpenAI创始人兼CEO Sam Altman曾表示:“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性工作。现在看起来,它会以相反的顺序进行。”
由此也掀起一场关于AI替代人类的讨论,插画师、媒体工作者等从事内容生产的群体感受到了危机,抵制AIGC的声音此起彼伏。只是历史的车轮滚滚向前,技术的发展并不会因为人类的怀疑而有所停留。
“这项技术出来了,你就不可能再把它塞回去,”阿文表示,“这是一场离我们特别近的技术革命,我们能做的就只有调整心态迎接它。”
在AIGC逐步“爆发”的过程里,看似两条路径的ChatGPT和AI绘画,其实始终由一根线串连。想了解整个过程,要先看回这根线的始端:ChatGPT背后的科技公司,OpenAI。
背靠微软的全球顶级AI实验室OpenAI提出了强大的预训练语言模型:GPT(Generative Pre-trained Transformer)系列,这一系列的模型可以在非常复杂的NLP任务中完成诸如生成文字、生成代码、回答问题等。有趣的是,2018年,当第一代GPT刚刚面世时,一心专注于强化学习的OpenAI还只是用它来做语言理解方面任务,未曾想到,GPT的生成潜力才将是带领该公司走向闻名的技术道路。
这并没有持续很久,在GTP-2出世之时,OpenAI显然已经发现了GTP真正的强项。得益于更高的数据质量和更大的数据规模,彼时GTP-2生成的故事在流畅度和逻辑性上已经有了惊人的效果。
更大的转变在2020年,也就是GTP-3的现身。1750亿参数的GPT-3曾一度是AI历史上最大的机器学习模型,预训练的数据量是GTP-2的十倍不止。至此,OpenAI对GPT-3的期望已经放在了实用性和通用性上,商业化路径逐渐显露,释放出API接口供公众调用,不到一年就吸引了约300家公司。
随后的一年里,OpenAI进行了多次多模态的探索,比较知名的是文字生成图片的模型DALLE和DALLE2,可以将它们理解为是GPT-3的图像版本。尤其是2022年推出的新版DALLE2,其使用的扩散模型将图片的生成提升到了一个新的高度,对文字的理解更加精确、绘画水平更高、渲染更快,已经可以生成完整的人像和图片,AI绘画的能力开始被更多人关注。
今年8月,借鉴DALLE2的思路,Stability AI的Stable Diffusion模型横空出世,该模型是最新的扩散模型,能够在消费级显卡上实现DALLE2级别的图像生成,生成效率却提高了30倍。目前在该模型下,AI生成的图片已经具有极高的艺术性,甚至可以与专业画师媲美。此外,与DALLE2不同的是,Stable Diffusion完全免费开源,所有代码均在GitHub上公开,任何人都可以拷贝使用,这为AI绘画带来新的生机。
目前,Stable Diffusion的各渠道累计日活用户超千万,已经吸引超过20万开发者。其背后的公司Stability AI作为初创公司,于10月宣布获得了1.01亿美元超额融资,估值已达10亿美元,成为新晋独角兽。而在这波AIGC的浪潮里,开头提到的领头企业OpenAI,如今估值更是已经超过了200亿美元。
在红杉资本一篇名为《生成式AI:一个充满创造力的新世界》(Generative AI: A Creative New World)的文章中,红杉表示,生成式AI,让机器开始大规模涉足知识类和创造性工作,这涉及数十亿人的工作,未来预计能够产生数万亿美元的经济价值。
这点出了AIGC的商业化前景,一时间赛道火热,国内外龙头纷纷下场。
今年9月底,Meta发布了一个新的人工智能系统Make-A-Video,可以基于文本提示生成短视频。紧接着,Google也发布两款文本转视频工具,分别是强调视频品质的Imagen Video,以及主打视频长度的Phenaki。这较此前提到的文本生成图像来说又是新一轮的技术升级。
国内大厂中,百度、阿里、商汤、美图等企业都有AIGC的相关布局,百度创始人兼首席执行官李彦宏在出席2022联想创新科技大会时表示,过去一年无论是在技术层面还是商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。
西湖心辰COO俞佳在接受21世纪经济报道记者采访时表示,已明显感受到AI生成文字和AI生成图像发展到了商业可用的阶段。去年年底,西湖心辰上线了Firday平台,聚焦AI写作;今年8月,AI绘画平台盗梦师上线,创造出日增5万用户的增长速度。
从应用角度来看,如今的AIGC作为工具来说无疑已经是成熟的。
以文字生成为例,据俞佳介绍,西湖心辰的Firday平台可以生成短视频脚本、口播、营销文本,甚至雅思作文等,基本与国际上普遍的文字生成功能大同小异。
而这样的商业模式已经被证明是可行的。海外初创公司Jasper提供生成Instagram标题,编写TikTok视频脚本、广告营销文本等内容,截至2021年,已拥有超过70000位客户,包括Airbnb、IBM等知名企业,并创造了4000万美元的收入。在最新一轮的融资里,Jasper获得了1.25亿美元资金,目前估值已达15亿美元。
文字生成图片的应用虽仍主要是C端玩家的娱乐消遣,但已有专业用户逐步入坑。据百度AI绘画平台文心一格的相关负责人介绍,以文心一格为例,在辅助创作方面,该平台可以启发画师、设计师、艺术家等专业视觉内容创作者的灵感,提供创意思路,辅助进行艺术创作;在提升效率层面,可以为媒体、作者等文字内容创作者提供高质量、高效率的配图,提升创作效率。
近期,OpenAI已经与全球最大的版权图片供应商之一的Shutterstock达成深度合作,Shutterstock将AI绘画引入商业图库。有分析人士认为,随着AUGC的成熟和完善,AI绘画必将代替类似的图片素材。
“AIGC还处于非常早期,目前文字生成已经与行业结合得比较好了,图片生成也会是一样的,”俞佳表示,“毕竟行业本身的需求一直是存在的,只是之前还没有被满足而已。”
头豹研究院高级分析师朱晓雯告诉21世纪经济报道记者:“从目前来看,在部分细分场景,例如绘画、翻译等内容生产领域,可能会有很快的落地化普及,但要实现大规模的商业化落地,保守估计需要3~5年的时间积累才有可能。”
国盛证券认为,AIGC将是Web 3.0时代的生产力工具。当我们迈入Web 3.0时代,人工智能、关联数据和语义网络构建,形成人与网络的全新链接,内容消费需求飞速增长,UGC、PGC这样的内容生成方式将难以匹配扩张的需求。由此,将来文字生成、图片绘制、视频剪辑、游戏内容生成皆可由AI替代。
AIGC在短时间内带来的冲击有些大,正如阿文所说,我们正在经历一场技术变革。只是这场变革既然来得突然,就必然会带着众多问题和怀疑,就像所有新技术初来乍到时一样。
朱晓雯表示,当前,AIGC赛道尚处于孕育探索阶段,相关法律法规、技术伦理等问题仍亟待解决,短期内还难以实现大规模商业化应用。
版权是当下比较敏感的话题之一,也是很多人抵制AIGC的原因之一,在AI绘画领域尤为严重。一些原画师抨击AI绘画是未经授权作品的拆解和再拼凑,这也导致了接受AI技术的画师因担心侵权,在日常工作中不敢商用该技术。
出现这个问题的原因与用来训练AI的数据源有关,里面很多内容没有经过授权,而AI生成的成品中出现了与原画相似的痕迹。“但如果想都经过授权几乎是不可能的,比如一些非常好的模型,用的图可能有20亿张,不可能把所有的图都去跟图源作者确权。”阿文表示。
对于此,俞佳向记者解释称,AI作画的逻辑并不是搬运,而是通过学习了解了“画画”是一个怎样的概念,“如果一个小朋友从小就只看梵高的画,之后你让他自己创作,他很有可能画出来就和梵高的风格很像。”
浙江汉鼎律师事务所张永辉律师在接受21世纪经济报道记者采访时表示,著作权法中针对作品的独创性具有明确规定,作品必须具备独创性和可复制性。
“AIGC的绘画风格与绘画内容都是由用户通过网络技术设计而成,与普通画作一样,可以体现一定的智力水平和作者的创作表达,其生成内容具有思想表现形式的作品外观,应当获得著作权法的保护。”张永辉律师表示,“如果AIGC软件只是简单地复制粘贴原画作,或者照搬原作品成为自己的作品一部分,那就需要获得原作者的同意并支付使用费。”
创作者们对于版权问题的敏感程度体现了他们对于自创内容的珍视,而AIGC如今所能做到的几乎已经达到了创作者的平均水平,人类创作的价值突然被降低,这也是一些人抵制新技术的另一层原因,由此引出了那个老生常谈话题:AI会取代人类吗?
回答此问题或许可以从一段历史中窥见结果。
19世纪时,法国诗人Charles Pierre Baudelaire曾称摄影为“艺术最致命的敌人”,原本以写实为目标的绘画作品在照相机问世后变得失去了意义和光彩,人们对真实的定义出现新的变化。但这却促使了画家们思考如何化危为机,并积极探索出绘画艺术的新形式。19世纪六七十年代,以莫奈马奈为代表的印象主义画派产生,打破了写实油画长期一统天下的局面,艺术又迎来了新的春天。
这与AIGC的发展是类似的。AI并不会扼杀人所有的意义,而是会开辟更多可能性。“人与AI一定会是一个协同的形式,”俞佳认为,“人并不会丢了饭碗,但他的角色会产生变化。”
李彦宏曾公开表示,AIGC需走过“助手阶段”“协作阶段”和“原创阶段”三大阶段。俞佳认为,如果按照这个来分,目前的AIGC已经处于“协作阶段”,即除单纯辅助外,AI还在一定程度上扮演引领者的角色,为人类提供灵感和思路。
朱晓雯认为,一方面,AIGC还需针对需求离散化和时间精力的有限等痛点展开,进一步拓展深度学习等;另一方面需要对制作内容进行一定的管控,需要有完善的法律法规,确保其发展为一项有效、合规的高科技产业。
阿文的态度则更为开放,他认为知道风向在哪里,及时调整自己就可以。“把AI纳入到自己工作流程,我觉得是一个迟早的问题。既然躲不掉的话,还不如早一点拥抱它。”