智东西(公众号:zhidxcom)
作者 | 徐珊
编辑 | 云鹏
“戴上眼镜,我可以一边逛展,一边看到二维码扫描出来的数字信息,了解更多展品的细节。”在进博会的人工智能体验区,不少参观者戴着奇点智能眼镜开始逛展。这款智能眼镜,正是由上海智能眼镜创企奇点临近打造的全天候智能眼镜。11月8日,奇点临近还开售了QIDI ONE开发者版(QIDI ONE INFINITY EDITION),价格4999元起。
奇点临近创办于2021年12月,创始人兼CEO张慧敏曾是华为P和Mate旗舰机核心开创者之一,也是华为手机第一位首席科学家、第一位首席架构师。继去年亿元级天使轮融资后,今年7月,奇点临近又拿下了阿里的数千万元战略轮融资。
在见证并深度参与消费电子多次产业升级后,张慧敏认为智能眼镜将成为下一代智能终端,而一款真全天候智能眼镜需要具备以下特点:要舒适轻便、能长时间佩戴的眼镜形态;能提供第一视角感知识别的一体机;能实现即时全息显示,融合数字和现实世界的信息;且能提供符合自然直觉的裸手交互。
对张慧敏而言,QIDI ONE开发者版正是他对全天候智能眼镜设想的初步实践,具有高透高亮、重量轻、一体机、续航长等几大要素。QIDI ONE开发者版重量在80g左右,采用的是LCOS+双目阵列光波导的光学方案,显示亮度最高能够达到3000nits,透光率大于85%。在轻度使用场景中,QIDI ONE开发者版的续航能力能够达到3-4小时左右。
▲QIDI ONE开发者版智东西实拍
QIDI ONE开发者版也是奇点临近在日益火热的智能眼镜赛道上交出的一份产品答卷。据不完全统计,2023年智能眼镜玩家们已经先后发布10余款新品。国际调研机构IDC显示,2023年上半年,AR出货6.8万台,同比上涨142%。“AR赛道已经进入到高速发展期。”张慧敏说道。
但现阶段用户需要什么样的智能眼镜?奇点临近又是如何定义一款智能眼镜新品?智能眼镜市场将在未来3-5年内发生怎样的变动?我们对话了奇点临近的创始人兼CEO张慧敏,看到奇点临近在智能眼镜范式上的探索、思考以及实践。
每家智能眼镜厂商在打造一款智能眼镜新品之前,都要找到同一个问题的答案——“我们想要打造一款什么样的产品”。奇点临近认为要通过用户的使用场景去反推用户所需要什么的产品,随后设下高透高亮、续航时间长,重量轻三大智能眼镜特征,并围绕此打造了QIDI ONE开发者版本的一系列亮点功能。
戴上智能眼镜,当你看向朋友时,智能眼镜会通过人脸识别朋友的身份信息,并随之将信息展现在你的前面。这项功能曾在不少AR玩家的设想中出现,但今天我们在进博会上,借助QIDI ONE开发者版本,终于实际体验到“AR名片”功能的魅力。你可以通过手机直接扫描各式各样的名片,同时拍摄人脸照片,无论在何时何地,你都能一眼识别出只有一面之缘的陌生人,并且最快获取背景信息。这样的功能对于脸盲患者,又或者是周旋于不同场合的商务人员来说,都是“社交神器”。
同时,AR翻译以及AR字幕两大功能的操作界面都相对比较简单,只要单击按下语音键就可以直接看到转录出的翻译文字。在体验的过程中,我几乎没有感受到明显的翻译时间延迟。
在一些基础功能的打磨上,奇点临近也摸索出一些新的玩法。比如说,当你打开Libra APP,你可以一边通过智能眼镜拍摄合适的风景画面,一边根据拍摄界面提供的信息调整拍摄手法。
不仅如此,QIDI ONE开发者版本能够呈现4米外85寸大屏,这也为其作为拓展性设备提供更多可能性。用户不但可以通过奇点1开发者版本连接Switch、Xbox打游戏,而且还能够连接无人机,直接看到无人机的拍摄画面,给每位用户提供一双“会飞的眼睛”,手机和电脑则更不在话下。
在智能眼镜中,奇点临近通过不同的APP向用户以及开发者们展示其显示、语音算法、图像算法等底层技术所提供的强大能力。“我们希望通过展示这些成果,让更多人能够通过我们所提供底层能力、底层技术,去开发适合他们所在行业的应用。”张慧敏说道。
在显示方案上,奇点智能眼镜选择了LCOS+双目阵列波导的AR光学方案。为了降低LCOS的功耗,奇点智能眼镜选择严格把关各个关键器件。据张慧敏介绍,某个同一位置的关键部件替换,可以实现同等功耗下提高30%亮度。“LCOS方案不代表一定功耗高,而是如果选不对器件的话,功耗将会高。但是,如果你能扎到供应链企业的深处,就能找到合适的器件,从而降低功耗。”选择LCOS方案的另一大原因是,能够支持85%透光率,且其入眼亮度能够达到3000nits,奇点智能眼镜在不需要遮光罩的情况下,能够满足大部分的室内、室外场景。
奇点自研的,拥有独立知识产权的自标定双目合像方案,实现了分体式左右显示模组的双目合像。通过结构定位,软件自标定的方式,突破硬件极限,将双目合像的精度做到了5’,并实现了行业首创的合像距离可调模式,达到行业领先水平。
在交互方案上,奇点智能眼镜拥有语音、触控两大交互方式,也可选配指环,其中,语音交互常常能够在智能眼镜中帮助用户快捷执行多项指令,但也会受外界环境所影响,常出现听不到指令,或者听不准指令的情况。前者更依托于麦克风的选型和位置设计,而后者则更需要软件层的算法支持。
通过奇点临近的语音声纹识别算法,能够让智能眼镜在声音比较嘈杂的地方,识别智能眼镜用户的声音,从而执行响应的指令。“目前我们的物流客户在仓库、机房里已经进行了上万小时的使用,语音指令基本能获得准确执行。”
在物流场景中,奇点智能眼镜的图像识别功能也经常被调用,工作人员能够一眼准确识别出不同货品上的二维码信息,相比于扫描枪的方式,直接解放了双手,大幅提升工作效率。
据介绍,奇点已经形成了一套行之有效的、多模态复杂场景的、轻量化小模型的环境感知万物识别的算法应用体系,通过基于应用场景的Camera定制开发、软件多线程框架设计及优化、深度学习算法ARM/GPU融合优化等软硬件一体化的开发,将行业中目标检测识别算法提升了十倍以上达到0.1s的极速识别,达到行业领先水平。
在张慧敏看来,无论是物流、文旅等商用市场,还是消费者市场,奇点智能眼镜都是为人打造的产品,因此都有共同的需求,比如说重量。“我们认为用户对眼镜的重量其实是非常敏感的,哪怕是多重3g或者多重5g都会影响用户的佩戴时间。因此我们在眼镜的重量上,下了不少功夫。”通过深度定制二三级的零部件,并且在系统工程一体化上反复打磨,目前QIDI ONE开发者版本的重量在80g左右。
▲QIDI ONE开发者版智东西实测
图像识别能力、语音交互能力以及显示能力,都是奇点临近为千行百业提供的“百宝箱”,支撑着各行各业将他们的创新想法落地实现。
智能眼镜,是张慧敏职业生涯中进入的第四个创新性赛道。从白电(冰箱、洗衣机等白色家电的代称),到功能机,到智能手机,再到智能眼镜,张慧敏已经非常熟悉如何从0到1搭建自己的团队。
▲奇点临近的创始人兼CEO张慧敏
据他透露,目前奇点临近有不少来自于华为旗舰机、大疆等顶尖团队的员工,并且他们还拥有一个相当优秀的嵌入式算法团队,帮助他们将各类应用轻量化“塞入”智能眼镜中。“有些关键技术难关,就需要找到专业的人来攻克,这也是我们的优势所在”张慧敏说。
“终端厂商是推动行业向前关键的一环,只有他们才知道用户真的想要什么。”多年的终端研发经验,让张慧敏不满足于停留在等待供应链技术成熟的层面,反而选择进一步推动供应链提升自己的工艺,共同打造出好的产品。
作为曾经见证手机如何从功能机转向智能手机的关键人物,他明确地告诉智东西,现在的智能眼镜就是智能终端,不是功能性产品。“智能手机更像是一个平台,集合了各种不同的APP,但智能眼镜是把屏幕内的信息和屏幕外的信息都放在眼前。”张慧敏认为智能眼镜是有独特性的,市场也是有需求的,但是目前苦于市场上没有好的产品。
同样,他认为造智能眼镜的思路也不能完全照搬造手机的思路,因为本质上产品的核心技术不同,但可以从定义产品的底层能力,选出超越用户期望的使用场景等方面借鉴手机创新的方法论。
而对于智能眼镜未来的发展,他提到乔布斯定义了智能手机的范式,现在市场上大家都在想成为智能眼镜范式的定义者。不过,据他推断,未来智能眼镜的范式可能不只1种,可能有2-3种类型。“我们希望奇点临近能够定义其中1款。”
在他看来,如果一款智能眼镜能够在不亏本、不营销的情况卖出50万台,这可能意味着智能眼镜即将迎来爆发阶段。他认为当AR产业达到成熟阶段时,可能会拥有15-20家进入智能眼镜赛道终局。
从2021年成立,到2023年11月公开发售QIDI ONE开发者版本,奇点临近交上了自己的产品答卷。奇点临近也通过QIDI ONE开发者版本直观向千行百业的人员展示智能眼镜能够提供的能力,并推动其加入创新应用的开发行列。
在这过程中,奇点临近选择在关键技术、关键器件选型以及重要场景上,不断调研、攻克难点,推动创新,不但摸透行业上下游的情况,也进一步给出自己对智能眼镜产品的定义。
在日益升温的智能眼镜赛道,QIDI ONE开发者版本将会给行业的开发者带来哪些改变?用户对新的功能体验又会有哪些想法?我们或许很快能从市场看到反馈。
https://zhidx.com/p/402611.html
Created by Tan KW | Nov 30, 2024
Created by Tan KW | Nov 30, 2024
Created by Tan KW | Nov 30, 2024
Created by Tan KW | Nov 30, 2024