9月14日报道 据《日本经济新闻》报道,人工智能(AI)技术已经开始涉及创作活动。
日本微软公司衍生企业Rinna开发出一项技术,人用日语向其描述想法后,AI可以据此进行相关艺术创作。时尚、内部装饰、设计之类的创造性工作将有可能由AI替代。
“位于北极的日本京都”、“和服的数字艺术”、“虚拟现实(VR)的世界”等等———用日语输入这些富有创意的语句后,AI就会生成令人联想到这些语句的图像。
技术进步
Rinna的技术是使用图像处理半导体(GPU),让其学习日语词汇与图像的1200万个配对,使其能够判定日语词汇和图像的匹配度。
将这种AI技术与制作图像的功能相结合,重复数百次生成图像以增强匹配度后,便能制作出符合语句内容的艺术形象。
这样的技术将来有助于时尚用品和室内装饰等设计。例如,即使制作者没有最初的明确想法,但如果模糊地用语言表达出来,就能制作出符合想法的插画,进而有助于设计的自动化。
Rinna的研究与数据经理泽田庆说:“希望通过公开这个模型,进一步活跃(企业等的)社群。”
精通艺术的东京都练马区立美术馆馆长秋元雄史说:“把想象的东西变成画或照片,从广义上可以说是艺术和创作活动。”
他表示,“AI的有趣之处在于,它可以创造出现实中没有的虚构画面,以前是人类才可能做到这样。今后这一分水岭将逐渐消失”,但“判断作品价值的是人类,创造性的主导权掌握在人类手中”。
人工智能涉足创作领域的原因在于,这一技术取得了飞跃性进步。
开放人工智能公司(Open AI)开发出了语言人工智能“GPT-3”,能生成像人类所写自然流畅的文章。
这种使用大规模数据进行训练、具有各种用途的高性能人工智能被称为“基础模型”,潜藏着为现有产业和商业模式带来革新的可能性。
Open AI使用GPT-3的语言人工智能技术,从2021年开始将其应用于从英语语句生成图像的人工智能上,把语言和图像关联起来进行研究。
7月,Open AI以注册制方式公开了AI的最新版本,生成的图像也可用于商业用途。它可以有多种实用方法,如根据英语的指示加工出实际的图像等等。
开发语言人工智能“BERT”的谷歌公司也于5月公开了能根据英语语句制作出符合其内容图像的人工智能。
其特点是忠实地再现细节描写。它可以根据“在院子里弹吉他、戴着牛仔帽身穿红衬衫的熊猫油画”等具体指示来制作图像,还可以把熊猫变成波斯猫,让它坐在滑雪板上而不是弹吉他。
也有能直观制作图像的AI。一家公司公开了只要在电脑上画出大致草图,就能制作出像照片一样风景画的人工智能。能将线条和涂抹笔触转换成飘浮在空中的云朵和旺盛生长的草木等。
运营插画的网站pixiv和人工智能开发公司Preferred Networks(PFN)合作,尝试向出版社等提供自动为漫画人物着色的服务。只需准备一份着色样本,AI就会根据样本分辨出头发、衣服、背景等的位置并进行着色。
PFN还提供可用人工智能生成卡通形象的服务。其特点是不仅可以生成脸部,还可以生成上半身,并自由设定其面部表情和头发的颜色等。8月时这一技术就可用于视频播放、游戏角色、CD封面照片等商业用途。
作弊指责
另据美国《纽约时报》网站9月2日报道,今年,科罗拉多州博览会的年度艺术竞赛颁发了所有通常类别的奖项,包括绘画、绗缝和雕塑。
但是,一位参赛者———科罗拉多州西普韦布洛的贾森·艾伦———并没有提交用画笔或黏土创作的作品。他是用Midjourney这个人工智能程序进行创作的,该程序能将文本转化成超现实的图片。
艾伦的作品《太空歌剧院》赢得了博览会新兴数字艺术家竞赛类别的最高奖项———从而成为首批赢得此类奖项的人工智能生成作品之一,而这也引发了艺术家的强烈反对,他们指责艾伦本质上是在作弊。
报道称,人工智能生成的艺术作品问世已有多年。但是,今年推出的人工智能工具———比如DALL-E 2、Midjourney和Stable Diffusion等———已经使业余爱好者仅仅通过在文本框中输入几个单词就可以创作出复杂、抽象或具有照片真实感的作品。
报道称,这些应用程序让许多艺术家对自己的未来感到不安,这是可以理解的———他们担心,如果程序自己就能生成作品,还会有人为艺术付费吗?它们还引发了有关人工智能生成艺术的职业道德的激烈辩论,并招致一些反对声,反对者声称这些应用程序本质上是一种高科技抄袭形式。