人工智能对话机器人ChatGPT引发的热议愈演愈烈。科技圈正在迎来大变局。
北京时间2月8日,微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎必应和Edge浏览器。微软首席执行官表示,“搜索引擎迎来了新时代”。微软股价大涨4.2%,市值飙升800亿美元(约合人民币5400亿元)。
几乎同时,谷歌首席执行官桑达尔·皮查伊紧急宣布人工智能对话式机器人“Bard”(吟游诗人)正在内测,并在未来几周内向大众提供服务。谷歌也将整合新的人工智能到搜索引擎中。据了解,谷歌投资的一家人工智能初创企业由从OpenAI离职的高管和开发者组成。
2月7日,百度宣布将于3月在中国推出类似ChatGPT的人工智能聊天机器人“文心一言”,消息一出百度港股涨幅快速扩大,截至收盘大涨15.33%。腾讯、阿里、华为也纷纷宣布正在申请人工智能人机对话专利。
ChatGPT引领的人工智能概念在资本市场一路狂飙,相关题材持续发酵。截至2月7日,Wind ChatGPT指数今年以来累计上涨超50%。
投资机构普遍认为,ChatGPT的出现提升了自然语言处理能力的上限,打开了人工智能技术商业化落地且成为消费端爆款的大门,因此具有划时代的意义。
ChatGPT出圈背后,是火了一年多的AIGC
输入一句简短的话,AI就能画出一幅精美的画作;给出一个指令,AI就能写出不输人类水准的大段文字。在刚刚过去的2022年,人们已经被人工智能生成内容(AIGC)的创造力震撼了一次又一次。
ChatGPT出圈背后,则是其除了聊天外,还可以撰写邮件、视频脚本、文案、翻译、代码等,其全面的能力让不少人大呼自己有被人工智能抢走工作的危险。
“人工智能生成内容,是继专家生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式。典型应用形式包括写作、问答、自动编程、绘画、配乐、视频生成和 语音合成等。”中国信通院云计算与大数据研究所所长何宝宏长期观察科技行业,他在日前的一篇评论文章中表示,对话式人工智能近期的火爆程度超过了去年下半年就大火的人工智能绘画,因为“生成各种文字远比生成图片更震撼,应用的范围也更广”。
“AIGC的核心变革,发生在内容层,位于数据层之上。”何宝宏表示,AIGC在绘画和会话等方面突破的重要性,在人工智能领域“相当于2016年,阿尔法狗战胜人类围棋冠军的价值”。在互联网领域,则“堪比下一代互联网、下一代内容和未来社交网络等”,将影响到所有内容相关的产业,只会是“程度和早晚”的区别。
这些行业中,大量简单重复的工作,或将加速从人工完成转变为AI完成。在何宝宏看来,尽管ChatGPT等缺乏真正理解人类语言和对话复杂性的能力,只是被简单地训练为根据给定的输入生成单词和句子,产生的内容也可能是肤浅、缺乏深度和洞察力的,但他指出,事实上,“大多数文字工作者、大多数数字内容和程序员的水平,甚至都还达不到ChatGPT目前的水平。”更重要的是,ChatGPT的学习演进速度,是7x24小时持续进行的。
不过,在担心自己的工作是否会被人工智能取代之余,人们也可以看到,在人工智能的助力下,人们可能拥有的更多机会。何宝宏预测,未来10年到20年内,AIGC将使非程序员的创造者能够使用自然语言指令进行零错误的软件开发,让编程进一步平民化。内容创作也不会只有AIGC,而更可能是人机共创的,人在未来的文字性工作中,或将主要起到引导、监督和核查的作用。
七年进化实现人工智能蜕变
ChatGPT由美国人工智能公司OpenAI开发。后者成立于2015年,由美国创业孵化器Y Combinator总裁阿尔特曼、特斯拉总裁马斯克、PayPal联合创始人彼得·蒂尔、领英联合创始人里德·霍夫曼等硅谷科技大亨联合创立。
最开始OpenAI以非营利组织身份启动,该公司希望防止大型科技公司掌握人工智能技术并垄断其利益的未来。官网介绍称,OpenAI 是一家人工智能研究和部署公司。“使命是确保通用人工智能造福全人类。”
然而随着技术研发的投入和推进,公司意识到自身很难持续作为一家非营利机构运营。2019年,OpenAI 转型为一家营利性公司。
作为一家专门探索人工智能前沿技术的机构,OpenAI的技术研发进展首先在电子竞技游戏领域取得了令人瞩目的成果。2017年,由OpenAI研发的一款人工智能机器人在《刀塔2》1v1比赛中战胜了世界知名选手Dendi。第二年6月,AI战队OpenAI Five又在《刀塔2》5 V 5模式中击败了人类的业余玩家。此后,该机构在数个领域又取得了里程碑式的进展。
2019年,OpenAI推出了可以单手解魔方的仿真机器手Dactyl,其通过机器自主学习实现。OpenAI 将这一壮举视为机器人附件的灵活性和自身人工智能软件的飞跃,“我们相信,成功地训练这样一只机械手来完成复杂的操作任务,将为通用机器人奠定基础。”
2020年6月,OpenAI发布了第三代生成式预训练模型GPT-3。GPT-3拥有1750亿个参数,相比之下,2019年发布的GPT-2包含15亿个参数。这使它能够完成多种更为复杂的任务,包括答题、写代码、创作、翻译等。有传闻称GPT-4很快就会出现。
2021年1月,OpenAI发布了DALL·E模型,人工智能根据一段话就可直接生成图像。一年后,公司又推出了2.0版本,不仅分辨率提到了4倍,还允许对图像输出进行简单修改。
2022年11月,OpenAI 发布了聊天机器人ChatGPT,其强大的智能聊天功能吸引了海量用户,据估计,ChatGPT 在一月份的活跃用户达到了大约1亿。
在产品火爆之际,OpenAI 近日也宣布推出ChatGPT 的付费版本 ChatGPT Plus,这项订阅服务每月收费20 美元,可以让用户在高峰期依然顺畅使用产品。官方还表示,该服务将给用户提供“更快的响应时间”,并且能“优先使用新功能”。与此同时,免费版本依然保留。据悉,OpenAI 还计划在未来推出 ChatGPT 移动应用程序。
巨头纷纷入局:围绕人工智能的激烈竞争
在这场变局中,微软在人工智能上似已拔得头筹。
2019年,微软向OpenAI投资10亿美元,双方达成协议合作开发“通用人工智能”,同时微软获得将OpenAI的部分技术商业化的权限。今年1月,微软又表示,将对OpenAI进行为期数年、价值数十亿美元的投资,有知情人士透露,微软曾讨论向OpenAI投资至多100亿美元。
2月7日,微软推出新的人工智能搜索引擎必应和Edge浏览器。必应正在进行大规模的升级,允许用户与其聊天,以搜索查询更详细的答案。OpenAI 首席执行官证实,微软将OpenAI的一些GPT-3.5语言技术融入到必应中,以提高必应的性能。
据官方消息,继微软宣布在搜索必应、办公全家桶Office嵌入ChatGPT后,CEO纳德拉宣布还将在云计算平台Azure中整合ChatGPT,宣告Azure OpenAI服务全面上市,通过该服务可以访问OpenAI开发的AI模型,“届时微软每个产品都将具备相同的AI能力,彻底改头换面。”
搜索引擎巨头谷歌迅速回应,将在未来几周推出聊天机器人Bard,与ChatGPT一样,Bard建立在大型语言模型之上,谷歌母公司Alphabet首席执行官桑达尔·皮查伊表示,这个工具“寻求将世界知识的广度与我们庞大语言模型的力量、智慧和创造力结合起来。”
此前,谷歌向生成型人工智能初创企业 Anthropic投资了约3亿美元。这家ChatGPT竞品公司的创始团队正是此前从Open AI离职的高管和开发者,团队正在开发一款名为Claude的人工智能聊天机器人。这笔投资为谷歌换取了大约10% 的Anthropic 股份,与此同时,谷歌云也可以处理 Anthropic 的计算需求。
“毫无疑问,谷歌和微软围绕人工智能的激烈竞争正在我们面前发生,”一位来自与谷歌云计算和微软合作的解决方案提供商的业内人士表示,“这将改变人工智能的格局。你看看这些初创公司现在赚的钱和投资,肯定会是一场有趣的比赛。”
国内科技企业也在纷纷投入。2月7日,百度确认,将在今年3月推出类似于ChatGPT的产品,这一大模型新项目名字为“文心一言”(英文名ERNIE Bot),预计3月份完成内测面向公众开放,目前正在做上线前的冲刺。
百度还介绍称,百度在人工智能四层架构中,有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言位于模型层。公司同时强调,“百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE ,具备跨模态、跨语言的深度语义理解与生成能力。”
值得注意的是,近日,多家知名互联网公司纷纷公布人机对话相关专利。其中,腾讯科技(深圳)有限公司申请的“人机对话方法、装置、设备及计算机可读存储介质”专利可实现人机顺畅沟通; 阿里巴巴达摩院(杭州)科技有限公司申请的“人机对话及预训练语言模型训练方法、系统及电子设备”专利可提升问答交互的准确性;华为技术有限公司申请的“人机对话方法以及对话系统”专利可识别用户异常行为。
引发监管讨论:用人工智能来应对人工智能?
ChatGPT等AIGC的大规模应用,将进一步模糊真实与虚拟、人类与机器的界限。何宝宏表示,对AIGC的监管,将是个巨大的新挑战。
虎符智库研究员李建平表示,如同其他人工智能模型一样,ChatGPT是把双刃剑,既可以是提升效率的工具,解答人们的各种问题、创造出大学水平论文,甚至编写代码,也可能被绕过安全机制,用于实施有害的活动。
网络犯罪分子使用 ChatGPT 造成的“最紧迫和常见的威胁”主要包括网络钓鱼、社会工程和恶意软件开发。李建平表示,研究人员发现,ChatGPT 等GPT-3工具使犯罪分子能够逼真地模拟各种社会环境,从而使任何针对性的通信攻击都更加有效。GPT-3这类语言模型提供支持的工具,使攻击者更易诱骗受害者提供敏感信息或下载恶意软件,加速从网络钓鱼到传播仇恨言论的所有级别和目的的攻击。
此外,ChatGPT还降低了网络犯罪的门槛——即使没有技术,也能成为攻击者。其带来的网络威胁还有可能蔓延到异次元。
因此,ChatGPT相继被不少机构封禁(Stack Overflow、高校、协会等),部分原因是模型目前仍然会生成一些虚假错误内容,并且难以辨别。
李建平表示,ChatGPT等人工智能工具会以比人类罪犯更快的速度制造出新的、日益智能的威胁,传播威胁的速度也会将超过网络安全人员的反应速度。对于机构来说,跟上这一变化速度的唯一方法是通过使用人工智能来应对人工智能。
一方面,网络安全行业的研究人员、从业者、学者和企业可以利用ChatGPT的力量进行创新和协作,包括漏洞发现、事件响应和钓鱼检测。此外,随着ChatGPT等类似工具的发展,未来开发新的网络安全工具更加重要。安全企业应更积极地开发和部署基于行为(而非规则)的AI安全工具,来检测人工智能生成的攻击。行为分析通过使用复杂的机器学习算法来分析整个企业的用户和实体数据,识别具有风险的行为,从而实现以人为本的防御。
此外,相关法规和监管措施已经发布施行。2022年12月11日,国家互联网信息办公室、工业和信息化部和公安部联合发布了《互联网信息服务深度合成管理规定》,规定任何组织和个人不得利用深度合成服务制作、复制、发布、传播法律、行政法规禁止的信息,不得利用深度合成服务从事危害国家安全和利益、损害国家形象、侵害社会公共利益、扰乱经济和社会秩序、侵犯他人合法权益等法律、行政法规禁止的活动。此外,深度合成服务提供者和使用者也不得利用深度合成服务制作、复制、发布、传播虚假新闻信息。该规定已于2023年1月10日起施行。
深度合成技术,指的就是利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。而类ChatGPT应用就符合规定中定义的“篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术”。在AI绘画、AI换脸等应用大火之后,对于AIGC等新型内容的监管,或许也将会成为接下来一段时间社会各界关注的重点。