FBEC2023未来商业生态链接大会暨第八届金陀螺奖于2023年12月8日在深圳福田大中华喜来登酒店6楼盛大召开,本次大会由广东省游戏产业协会、深圳市互联网文化市场协会指导,陀螺科技主办,中国光谷、游戏陀螺、VR陀螺、陀螺财经、陀螺电竞联合主办。
大会以“合力共生·韧者行远”为大会主题,以具有行业前瞻洞察的“航行者”为视角,破冰之旅为主线,关注AI、元宇宙、XR、游戏、电竞、数字经济等科技与互联网前沿领域,全方位呈现科技前沿成果,聚焦时代与商业热点议题,探讨新科技、新商业、新模式的未来价值,与真正的勇者共赴剧变革新下的凛冬破冰之旅!

FBEC2023主会场B:乘势而上,稳舵远航——2023全球VR/AR产业与空间计算论坛邀请到Rokid副总裁 & XR中心负责人 王俊杰带来主题为“Rokid,开启空间计算全球化时代”的精彩演讲。王俊杰认为,我们正在经历一场信息流从二维的手机电脑展示,到空间展示的信息革命。在未来,每一寸空间都可以自由定义数字内容。

图片6.png

以下为演讲实录:

大家好,我是Rokid王俊杰,很荣幸受主办方邀请在此进行分享,我的分享主题是《Rokid,开启空间计算全球化时代》。

前面案山子老师提到过,在这个时期,整个XR行业都在蓄势待发,Rokid也是。Rokid是一家隐藏在精美硬件产品中的系统软件公司。为什么这么说?因为从2014年成立开始,Rokid就聚焦于市场需求,从场景、软件出发,定义不同硬件产品的迭代。满足不同的市场领域,涵盖To B和To C等各个时期的眼镜产品。在整个产品研发的过程中,我们夯实技术基础,在系统技术、语音识别、图像识别、光学显示、交互技术等技术领域构建了独立自主的研发能力。

回到今天的主题,空间计算。众所周知,信息处理领域涵盖复杂,包括对外部环境的感知、理解、交互、协同,以及基于平台的数字内容创作。对空间计算而言,空间交互是关键组成部分,具备高标准的技术要求。首先要具备实时性,要能够快速捕捉、追踪和渲染;同时要具备高精度,通过强锚定感达到极高的虚实融合效果,否则容易失真。其次,高可扩展性,要能够支持不同的硬件设备和应用场景。同时,要具备丰富的交互方式,比如手势、语音、眼动等等,以便自然的交互操作。还需要有个性化,针对外观、功能、特性的差异实现丰富的个性化需求。最后,还要具备数据和隐私安全。空间交互具备这些特性,可以把物理世界和数字世界融合起来,让信息可以充分展示,人可以和信息自然互动。

回顾历史,全球第一台物理计算机,可能是古代的算盘,通过物理的输入和输出就可进行简单的数学运算。在此基础上,后续实现技术突破后,计算迁移至屏幕之上,数字技术和交互技术得到了长足的发展。但无论如何,这些技术发展都会被限制在小小的方寸之地,而空间计算就是打破该限制的主要途径。

根据场景的不同,我们陆续推出了系列产品,一是Glass 2、头环形态的X-Craft等针对专用场景的AR工具,二是以Station+Max的To C组合为代表的AR设备。我们持续思考的问题是,怎样进入一个真正具有个人计算平台性质的AR时代?要从几方面入手,首要因素是空间信息的定义,它的形式可以是视觉、听觉上的。其次是空间信息显示,空间非常广阔,对于如此广阔的空间,信息不能过于爆炸,如何优雅地在其中显示?在信息布局和呈现方式上需要精心设计。此外,人和空间信息的自然交互形式,是通过手势,通过语音,还是通过其他的方式,在不同的应用场景下需要做合适的选择。最后是形态表现,它应该长什么样?目前形态存在多样性,但本质上而言,眼镜必须兼具轻便与舒适。要追求以上的空间计算能力,适合采用分体形态,感知和显示由头显处理,算力、电池等部分由边缘计算承载,通过分体形态可达到出色效果。

在此背景下,今年8月份,Rokid推出了AR Studio空间计算套装以及相应的YodaOS-Master操作系统,并基于单摄构建了空间闭环。为什么用单颗摄像头,而非多颗摄像头?主要是考虑重量、功耗、结构稳定、单通道算力要求相对低等优势。基于前述的空间交互,我们打造了整套6DoF的SLAM技术以及自然交互的3D手势,通过将其融入系统,使整个系统拥有统一的交互界面和体验。当然,Rokid也正通过算法优化、硬件加速,实现更为优质的体验。

Rokid着力打造开放生态,也发布了Rokid UXR2.0 SDK。8月份发布后,现在已经有很多开发者基于该SDK,利用Rokid空间交互能力展开相关空间计算场景的开发。

目前,我们主要提供四个主要能力:(1)多模态交互,提供3Dof、6Dof等多空间定位技术,还有手势、语音、头控、射线控制器等。(2)原子算法能力,将算法融入系统,推动整个应用自然流转。(3)多种开发工具协同。提供性能监测模式,让开发者可以专注于的内容开发,监测应用自身的性能表现。(4)多生态支持。Rokid很早就开始支持OpenXR标准接口和主流引擎,比如Unity开发者可以轻松开发和移植他们的AR应用。同时,在Master系统里,我们内置了JS AR引擎和小组件容器,Web开发者可以轻松上传自己的组件,在系统中让大家使用。

整体系统架构共分为三层,底层是基础系统,算法、系统能力、软件能力集中在中间能力层,上面是提供给开发者的SDK,以及面向行业、面向普通用户的应用。

Rokid创造了一种信息流的展现方式,如何利用这种展现方式?大家以前是手机上直接浏览、上下刷、瀑布流的方式,而空间出现后,信息的另外一种布局方式出现,通过空间化的方式,所见即所得,所见即所点,让大家更自然地流转信息。在手势操作方面,Rokid持续打磨底层算法技术,可实现偏低位置的点击、触摸等远场手势,同时也可和虚拟物品进行近场交互,手势在空间计算中是非常重要的一种交互手段。

Rokid提供了空间计算的创作和体验的编辑器解决方案,分为创作端和体验端,即灵境 ARMaz 3。该套工具的应用领域涵盖博物馆、展厅,适合在大空间尺度下进行空间定位和交互。在创作端可进行拖拉拽操作,具有非常好的体验。

回到生态这个话题,不限于此前展示的核心场景,生态也提供了更为多样的内容,包括Unity生态和安卓生态。Rokid致力于打造各种活动,吸引开发者提供更多的优质内容。我们认为,AR是一个注重体验的产品,最好的方式是让用户关注内容而非设备本身。

在产品方向,Rokid同步深耕To B和To C。在To B方向,覆盖了企事业、文旅展陈、教育、医疗等等,开发者也持续提供了非常多创新性场景。

数字文化方向,目前覆盖了全国两百多家主流的博物馆和景区,取代了以往传统人工导游或讲解器的方式,AR眼镜可以展现更丰富的数字内容,并且通过空间技术实现内容互动。

在企事业端与工业应用方面,Rokid覆盖了电力、石化、轨交、医疗等数十个领域,聚焦于一线员工效率和体验的升级。在过去,绝大多数制造业是用Pad进行相应的自动化或信息化的处理,而眼镜可以解放双手,信息通过摄像头直接传递到后台的专家,专家进行后台的实时标注,让信息迅速展现在一线员工面前,进行最直接、最自然的信息交流,有效提升效率和体验。

最后,这是我们官网,这里是对外的合作渠道,在这里也真诚地邀请各位嘉宾和朋友来Rokid进行交流和体验,因为空间计算最重要的是体验。

今天我的分享到此结束,谢谢大家。