自(zì)聊天机器人ChatGPT火爆以(yǐ)来,微软公司创(chuàng)始人比(bǐ)尔·盖茨已多次公(gōng)开谈论人工智能话题。在(zài)最近的一(yī)次采访(fǎng)中,他再次(cì)表示:“AI可能会让科技行业迎来一次剧烈的(de)洗牌”。
这(zhè)个结论是他在当地时(shí)间2月20日接受(shòu)《In Good Company》节目(mù)专访时提出的。
他(tā)预期,AI的发展可(kě)能(néng)会威胁(xié)到谷歌的市占率(lǜ),因为微软在AI方面的(de)行动(dòng)相当迅速(sù)。而最终科技巨头(tóu)将把(bǎ)AI整合成用户的“全能助手”,包揽一切应用,与人们进行沟通(tōng)并提供建议(yì),可以取代亚(yà)马(mǎ)逊、Siri或Outlook等应用。
大佬(lǎo)口中全能助(zhù)手的到来可能(néng)尚需时日,但由ControlNet引发的又(yòu)一次AI绘画浪潮,让(ràng)AIGC在ChatGPT的(de)话题热(rè)点(diǎn)包围中杀出(chū)重围(wéi)。
01
ControlNet颠(diān)覆AI绘画(huà)新玩(wán)法
AIGC向可控靠近(jìn)
以AI绘画为(wèi)代(dài)表的AIGC上一次爆(bào)火的时(shí)候,还是2022年8月,在美国(guó)科罗拉(lā)多(duō)州举(jǔ)办的新兴数(shù)字艺术家(jiā)竞赛中,一幅名为(wèi)《太空歌剧院》的作品获奖。
随后各(gè)大厂商的AI绘(huì)画软(ruǎn)件被广大网友熟知并体验,Stable Diffusion便是其中代表。
用户们可以在应(yīng)用中输入(rù)一(yī)组(zǔ)关键词或者一张照(zhào)片,就(jiù)能获得一(yī)幅(fú)AI创作的(de)画作(zuò)。
作(zuò)画的关键就是所输入的文本。同一组关键词也可以创作(zuò)出很多张风格不一样的画作,这让创作的过程就(jiù)像开盲盒。
很多用户很(hěn)喜(xǐ)欢这(zhè)种不(bù)确定(dìng)的惊喜(xǐ),他们会将生(shēng)成的美图(tú)当做头(tóu)像。而另(lìng)一部分喜欢翻看(kàn)AI绘画的“翻车(chē)”作品。在(zài)社交媒体上,许(xǔ)多(duō)用户分(fēn)享AI“翻(fān)车现场”,例如(rú),一位网友的小狗照片被(bèi)AI画(huà)成(chéng)了“肌肉男”,还有网友的(de)个人(rén)照片被AI识别成了(le)建筑。
而如(rú)今(jīn)随着ControlNet的出现与加持(chí),以往(wǎng)AI绘画的填写关(guān)键词游(yóu)戏可能要被颠覆了。
ControlNet是一位正在(zài)斯坦福读博的(de)中国(guó)人张吕敏(mǐn)创作的一种基于控制点的图(tú)像变形(xíng)算法,主要用(yòng)于数字图像处理(lǐ)、计算机视觉(jué)和计算机图形学等领域(yù)。
其SD插件一(yī)经发(fā)布(bù),在短短的两(liǎng)天内便成为了AI绘画(huà)领域最新的(de)热点。
在此之前,大家用了(le)很多方(fāng)法(fǎ)想(xiǎng)让AI生成的(de)结果尽可能的符合(hé)要求,但是都不尽如人(rén)意,它的出现代表着(zhe)AI生成开始进入真(zhēn)正的可控(kòng)时期(qī)。
因为ControlNet可(kě)以直接提取画面的构图(tú),人(rén)物的(de)姿势和(hé)画面的深度(dù)信息等。有了(le)它的(de)帮助,就不用频繁的用提示词(cí)来(lái)碰运(yùn)气,抽盲(máng)盒式的(de)创作(zuò)了。
通(tōng)俗(sú)的说ControlNet相(xiāng)当于给AI绘画(huà)加了“魔(mó)法”,不少博主的作品(pǐn)已经获得了大量的浏(liú)览量,“viggo”就是其(qí)中之一,他用朋友(yǒu)的照片直接带她们走进(jìn)动漫世界。
viggo先(xiān)用StableDiffusion图(tú)片转文字。
再用Text2Prompt插件拓展(zhǎn)找(zhǎo)到吴亦凡现在在哪里关着对应的关(guān)键词;最后用ControlNet插件绑定骨骼开始换关键词(cí)试效(xiào)果。
通过图片(piàn)就可以看出来,效果十分惊艳(yàn)。
更厉害的是,除了真实(shí)的照片,草图也可以加上(shàng)“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍(shào)到ControlNet还能(néng)实现线稿转全(quán)彩图。大(dà)神张吕敏其本尊也亲自回应。
不(bù)得不(bù)说(shuō)当下AIGC已经变(biàn)得越(yuè)来越(yuè)强(qiáng)大,甚至输出的作品(pǐn)都(dōu)已(yǐ)经能以假乱真了。
02
难(nán)辨虚实(shí),AIGC技术力爆(bào)发
警(jǐng)惕安全问题
近日,“苏州金鸡湖有游艇party”的消(xiāo)息火(huǒ)遍网络,而经过(guò)警方辟谣这所谓的“party”可能是全国(guó)第(dì)一起AI绘(huì)图诈骗。
由(yóu)于这个活动(dòng)里(lǐ)面给出(chū)的美女照片都(dōu)是AI制(zhì)作的真人照(zhào)片绘(huì)图(tú),因为太逼(bī)真(zhēn),被大家(jiā)当成真事传(chuán)播了。
不过仔细观察可以发(fā)现,活(huó)动发起者提(tí)供的照片中有个很大(dà)的漏(lòu)洞(dòng)可以(yǐ)发(fā)现并(bìng)非真人,而是AI绘图(tú),那(nà)便是图片中女性的手指部分有的(de)存(cún)在异(yì)常(cháng)。
有行(xíng)业人事表示:“现在因(yīn)为手(shǒu)指部分的(de)绘(huì)画算法比较(jiào)复杂,AI还不(bù)太会画人的手,但最新(xīn)看到的图片已经有越来越完(wán)美的(de)AI模(mó)型出现,以(yǐ)后(hòu)可能就(jiù)完全没有(yǒu)漏洞了。”
类似的AI作图(tú)诈骗在国外也已(yǐ)有发生。据英国广播公司报(bào)道(dào),土(tǔ)耳其地震(zhèn)期间,有Tiktok用户使用AI合(hé)成了儿童受灾的假照片(piàn)发布到网络,以(yǐ)此诱(yòu)骗善良的(de)人打赏“捐助”从而实(shí)施诈骗。
目前随着技术发(fā)展(zhǎn),AIGC已经能做出真人照片(piàn)般(bān)的绘图效果,如果这(zhè)样的图片被用(yòng)来诈骗,将非常可怕(pà)。
此外AIGC还引(yǐn)发了很(hěn)多担(dān)忧(yōu),一方面,批判者认为AI在(zài)“学习”了大量前人(rén)的作(zuò)品之(zhī)后,其(qí)创(chuàng)作没有(yǒu)任何情(qíng)绪和灵魂(hún),难以和人类的艺术创作相提并论。
另一方面,AIGC背后(hòu)的版权、目前都(dōu)并没有得(dé)到有效(xiào)的解决,还(hái)有AIGC会不(bù)会代(dài)替人类“至高无(wú)上”的(de)创(chuàng)意。
马斯克也(yě)强调,人工智能的安全问题需要得到(dào)重视(shì),太晚就来不及了。
03
AIGC下一站除了(le)视频,还有远方
技术(shù)都是有两面性的,潜在的危(wēi)害并不(bù)能掩盖(gài)其光(guāng)辉(huī)的贡献。现在看来(lái),人工(gōng)智能技术将是第(dì)四(sì)次工业革(gé)命的核心驱动力量,将创(chuàng)造新(xīn)的增长奇(qí)迹。
过去一年,人工智能(néng)在技术(shù)和商业(yè)层(céng)面都有了巨大进展,AI绘画就是人工智能(néng)技(jì)术发生方向性改变的一个代表(biǎo)。其下一(yī)站或许就是视频。
此前,Meta和(hé)谷歌先后发(fā)布了几条(tiáo)引爆科技圈的短视频。这些视频(pín)引发关注(zhù)并非内容做得多(duō)优秀,反而(ér)都(dōu)非常简(jiǎn)单,比如一匹正在喝水(shuǐ)的马(mǎ),一(yī)只(zhǐ)画画的玩具熊,或(huò)者一段骑摩托车的(de)第一视角录像,随便(biàn)一个有手(shǒu)机(jī)的人都可以(yǐ)随手录下一段。
但这些短视频(pín)的创(chuàng)作(zuò)方式(shì)非(fēi)常简单,创作(zuò)者(zhě)仅仅需要向AI输入一段话,甚至只是说(shuō)一下要求,A吴亦凡现在在哪里关着I就可(kě)以根据(jù)需要(yào)生成一段视频。
谷歌发布的两个AI生(shēng)成(chéng)视频(pín)分别来自于Imagen Video和(hé)Phenaki,前(qián)者主(zhǔ)要突出的是高清,与(yǔ)Meta的Make-A-Video没有太(tài)多的(de)差(chà)别(bié)。
在Make-A-Video公布了AI生成的视频(pín)后(hòu),AI圈就已(yǐ)经(jīng)玩了一波梗,一个能够(gòu)做(zuò)出更高清视(shì)频的AI还不(bù)足以在短时间(jiān)内戳中兴奋(fèn)点(diǎn)。
Phenaki更加令人震惊的地方在于,它可以制作(zuò)出超(chāo)过(guò)2分钟的连贯(guàn)的也有确(què)切内(nèi)容(róng)的视频,这才是真正让人们感到惊喜的地方。因为无论AI生成的(de)视频多(duō)么高清,也只能(néng)是为内容生产者(zhě)提供(gōng)一个灵感,一(yī)个素材(cái),一(yī)个过(guò)场动(dòng)画。
不过能够制作出有具体剧情内容的(de)视频就意味着,一(yī)些视(shì)频创作(zuò)由(yóu)AI代(dài)替人工完成(chéng)已经(jīng)初步有了可能。
当下AI的发展速度已经超(chāo)过大部(bù)分人的想象。内容产业的(de)本(běn)质是(shì)供(gōng)给创造需求,AIGC作为全新的内容生产方(fāng)式,可以为内容产业(yè)带来更新的内(nèi)容风格、更快的生产速度,更(gèng)低(dī)的(de)生产成本,这(zhè)无疑会驱动内(nèi)容产业的(de)大爆发。
除了AI绘图(tú)、视频,AIGC技术还能应(yīng)用于音乐、代码、机器(qì)人动作等(děng)多种(zhǒng)内(nèi)容形(xíng)式的(de)生成(chéng)。不难发现该项(xiàng)技术不仅(jǐn)在(zài)游戏等(děng)行业能得到有效应用,对于下一代(dài)互联(lián)网各种元素的构建亦有(yǒu)关(guān)键意义。
从(cóng)商(shāng)业化的(de)角度来看,文(wén)化娱乐、教育、传(chuán)媒(méi)等(děng)诸多领域,本身就对基于AI的可视(shì)化内(nèi)容有强烈需求(qiú)。
因此,AI绘(huì)画及(jí)视频或不是结果,而只是AI进(jìn)程中的一块重要(yào)拼图,有(yǒu)望在(zài)技术更新的(de)加持下实现更大的应(yīng)用价值。
AI从(cóng)理解内容,走向了可以(yǐ)生成内容,甚至能够创造出独立价值和独立视角的内容。AIGC的再次出圈(quān),更代表(biǎo)着未来的(de)先进生(shēng)产力(lì)即将到来。
04
紧抓大模型与(yǔ)算力,牢固AIGC底座(zuò)
从技术(shù)的发展(zhǎn)也(yě)可以(yǐ)看出(chū),在语言大(dà)模型、图像大模(mó)型之(zhī)后,多模态大模型已经(jīng)成(chéng)为了(le)新的(de)趋势。
大模型被誉为(wèi)当前(qián)人工(gōng)智(zhì)能发展的智能底座,是(shì)全球竞(jìng)争最激烈的(de)研(yán)究方向之一,包括谷(gǔ)歌(gē)、亚马(mǎ)逊、百度(dù)、阿里、腾讯等众多头部(bù)企业都在竞相发力(lì)。
不(bù)过训练大模型(xíng)的确价格(gé)不菲,以国盛证券发布(bù)的《ChatGPT需要(yào)多(duō)少算(suàn)力》报告(gào)估(gū)算,GPT-3训练一次(cì)的成本约为(wèi)140万(wàn)美元。而对(duì)于一些更大的LLM(大型语言模(mó)型(xíng)),训练(liàn)成(chéng)本则介于(yú)200万美元至1200万美元高价之间。
以(yǐ)ChatGPT在(zài)2023年(nián)1月的独立访客平均数1300万计算(suàn),其对(duì)应芯片需(xū)求(qiú)为(wèi)3万多(duō)片英伟达A100 GPU,初始投入(rù)成本约为8亿(yì)美(měi)元,每(měi)日仅电(diàn)费就在5万美元左(zuǒ)右。
此(cǐ)外不论(lùn)是ChatGPT还是(shì)AIGC,都离不开(kāi)庞大(dà)算(suàn)力(lì)支(zhī)持(chí)。在关注各类大(dà)模型的发(fā)展同时(shí),更应该关注(zhù)算力网络的建(jiàn)设。
算力网络正驱动AI产业发展进入史(shǐ)诗(shī)级加速(sù)进(jìn)程,让AIGC及(jí)通用AI这一人工智能发展(zhǎn)的终极目标离得更近。
因为算(suàn)力可以对(duì)突破性技(jì)术创新提(tí)供大力的(de)支持。这方(fāng)面(miàn),多模态大模型是典(diǎn)型。作为面向未(wèi)来强(qiáng)人工智能、通(tōng)用人工智能的重(zhòng)要技术(shù)创新,多(duō)模态大模型已经在人工智(zhì)能领域(yù)提(tí)出了很多(duō)年,业界(jiè)也有不(bù)少技术突破,但是,多模态大模型进一步往下(xià)走,算力需求呈几何式上升,一(yī)般的(de)算力(lì)基(jī)础设施很(hěn)快(kuài)将(jiāng)难以胜任(rèn)。
从图像、文字、语音单独一项的(de)训(xùn)练(liàn),到双模态、三(sān)模态(tài)的(de)跃迁,让人工(gōng)智能可以灵活应对不同模态的转化、像(xiàng)人与世界交互一样自(zì)然,这方面,由算(suàn)力网(wǎng)络来驱(qū)动将(jiāng)有明显优势(shì)。
此(cǐ)外,还有很(hěn)多需要(yào)爆发式增长的算(suàn)力来支撑的技术创新,将在人工智能算(suàn)力(lì)网络(luò)支撑(chēng)下(xià)快速(sù)推进(jìn)。
AIGC已经露出曙光,期(qī)待在大(dà)模(mó)型(xíng)和大算力的支持下AIGC能持续颠覆内容生产的方式(shì),将创(chuàng)造的边际成本降低,让万众受益。
未经允许不得转载:太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司 吴亦凡现在在哪里关着
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了