周六的一早5点钟就从床上爬了起来,想写点什么。看看自己CSDN上的技术博客已经很久没有更新,心中不免惭愧。正好借助这次EG2023(EuroGraphics 2023)的学习,来谈点自己对于图形的观点。
经过一周在德国萨尔布吕肯的EG 2023会议学习交流,收获了眼界、方向和人才。
眼界:
先说眼界,图形这个入门门槛很高的领域在欧洲的发展虽然不及北美,EG的知名度也不及Siggraph,但是它的发展历史也可以追溯到1980年,甚至于早于我的出生:
这个列表像不像是世界杯主办国?这好似图形在欧洲的欧洲杯,能够看到法国、德国、英国经常是东道主,这也彰显了它们在欧洲图形的霸国江湖地位。而这次会议正是在德国小镇萨尔布吕肯的萨尔大学举办。
说起萨尔大学,我在网上做了功课,它的地理位置很特别,正好在法德边界(萨尔过去也曾属于法国),处于欧洲的中心交汇位置。且计算机科学乃至于图形学都是萨尔大学的No.1领域,在欧洲也是图形的一股领先新力量。
这次我参加了5天的会议,不仅仅有学术界的大佬,也有产业界的图形领军专家,它的议题方向设置也非常有意思,如下:
包含了教程、长短论文、教育、星计划和主题演讲,我参加了几乎全部。对于论文(Paper)部门,没有太多可讲的,它几乎是学术界会议都会有的环节。让我留下深刻印象的还是其它几个部分:
1. 教程:这个环节实际上更像是对基础知识的培训,比如Vulkan、HDR,甚至于图形学在人们生活中的广泛使用介绍,这里的图形是广义的,包括声音和媒体。而也是在这个环节,我碰到了AMD的老同事Macro,它的最新Vulkan著作刚刚出炉(搞了一本),后话人才那一部分再详细说
2. 主题演讲:毫无疑问,这是最最重磅的环节,在这个部分给我留下印象深刻的是斯坦福大学Gordon教授分享的Neural Graphics Pipeline,是一种结合图像和图形的新的渲染管线,在方向的那一个章节再详细描述。当然除此之外,荷兰TU大学的Elmar教授、以色列Tech大学的Mirela教授以及Google的年轻科学家Ben讲述了如何处理大规模纹理、复杂Mesh以及2D->3D的AI生成的话题。
3. 教育:这个环节很多人都不去听,是关于如何教授和学习图形学的。我去听了一场,参加了一个非常有意思的话题目这个topic叫做“Teaching AI for CG”。各个欧洲大学的老师对于AI和CG以及如何结合做了思想交流和碰撞,我也提了一个问题,尤其对于图形这样准入门槛很高的领域,AI如何在CG学习上起到帮助,同时又避免学术造假(比如AIGC),确实是一种矛盾,很有意思,给与思考和想象空间。但是,这同时给我们以深刻的思考:基于统计学的AI是否今后也是图形的一个重要发展方向,其实当下已经不可忽视。图形最终呈现出来的其实就是pixel,它无论是通过渲染,还是统计学AI的生成,都是可以的:
从上面可以看到,EG已经不仅仅是欧洲大学教授和学生展现自己的舞台,甚至于北美的大学(斯坦福)、产业公司(AMD、Google)都有渗透和参与,已经形成规模和影响力。
方向:
方向较多,篇幅因素,先写2个:
-
Vulkan: 2016年刚刚加入华为,Khronos发布了Vulkan的第一个版本1.0,我也在那个时间开始学习这个新的渲染API。因为曾经在AMD做过长达10年的图形驱动,所以理解Vulkan对我来说并不是一件很困难的事情。我几乎一口气在几天之内把Vulkan API和demo program都学习完了,并且用在了项目上。还能回忆当时在美国San Diego的办公室和同事们一起开发基于Vulkan的图库应用,拿到了2-3倍的性能收益让人非常兴奋。而2018年和腾讯天美基于一款大作的Vulkan优化更让我对这个新API深信不疑,它的管线可复用能力、SPRI-V的高效、通过驱动对硬件的精准控制、Compute和Render的完美结合都是不争地事实,相比GL/GLES有了突飞猛进的进步。但是,不幸的是在移动端驱动层的不成熟导致其没有得到广泛使用。
但如果你是一个图形领域的专家,你会很容易接受这一点,因为图形的任何新技术都需要耗费几年甚至十几年才可以走向成熟,这让我想起最近看的一本介绍Pixar发展史的书,介绍了傅里叶的发现是如何帮助图形领域的,傅里叶把声音和图像通过傅里叶变换都可以表达:
所以,图形领域没有一个突破性的技术是可以非常快应用的,都需要耐心。
而在经过7年后,Vulkan已经开始进入它的关键发展期了,这次有机会听到了Macro对于Vulkan的解读,又让我迅速拿起它的工程跑了一把它的Raptor Vulkan引擎:
我相信从现在到2025年会是一个Vulkan的黄金发展期:
同时Vulkan的扩展使用,如Mesh Shader、Compute+Render、RayTracing都是其可以不断演进且被使用的新方向,而图形驱动的稳定性也有了长足进步,相信Vulkan就像DirectX、Metal老大哥它们一样,可以迎来黄金周期 -
图形和图像的结合,或者是AI和CG的结合: 其实这个Idea已经不是在这次听EG2023所收获的了,Nvidia这几年从一家图形公司逐渐演变为AI公司,再到AI+CG的解决方案公司就是一个案例。从视觉最终结果来看,无论是渲染还是通过AI产生最终图像,都是像素。所以,在当下GPU硬件算力受限(尤其移动端)下,更需要AI图像的产生过程简化,其实在很多的插帧计算、2D动效中间生成、超分(如AMD的FSR)场景都已经使用了,无论是高帧率还是高画质结果,都可以借助于基于统计学的AI技术来做增强。
在最近非常火爆的Avator 3D上,其实用的会更加广泛,基于数据的学习,目前人脸、手部的Morph等都已经相对成熟,而人物整体的内容生成和动画还需要一些时间的发展:
这个方向也同时给我们很多的启示,传统的图形学本身就是一个集数学(线性代数、图论)、物理(物理碰撞)、计算机的一个综合学科,而AI和统计又增加了更多的元素,让未来的图形显示方案有了更多选择。而在选择解决方案的时候,是需要考虑多种技术的可能性和应用场景,结合需求找到高效可行的路径。
尤其针对大规模的mesh和texture,如何用好AI技术,更是一个重要的发展方向:
Google的这个分享就是基于NeRF来解决大规模的纹理压缩。这一领域,我们探索的还是偏弱,尤其是未来GPU+NPU叠加SoC的时代,更需要我们用好AI,结合CG产生更加高效地生成算法。
人才:
最后谈人才。
这次要感谢谭威,从2016年我们一起携手在华为搞图形至今,大家一直在这个方向上,从来没有改变过志向。
而对于自己,更是从2007年参加工作至今更是从来没有离开过这个方向,这是一种信念,更多地是一种热爱,或者叫对图形的激情。这次有机会又和大家在欧洲碰面,是令人非常高兴的:
同时,这次又让我和AMD老同事Macro、斯坦福教授Gordon等图形圈子里面的新生大拿们有了认识和连接,对于未来图形新的发展方向和工程落地有了合作点思考。
我还想把“传承”两个字讲出来,它在图形领域更是如此,从Catmall到Hanrahan,从Blinn到Gordan,从Alex Deucher到我自己,这样的故事仍然在继续,也希望这样的传承越来越多。
欧洲的图形沃土已经形成,中国的图形做起来仍需要时间,更需要热爱和信念,而不是急功近利,小打小闹。很幸运,OpenHarmony系统的图形栈已经纯自研,存在大的发展空间。
最后: 心中有远方,自然站的更高,看的更远。
文章评论