Rokid ALL in ONE——是玩具,更是生产工具
性能先进,接口较全,功能强大,技术开放,对开发者友好,设计简洁。
门槛较高,不适合消费市场。
自从苹果和谷歌相继推出智能语音交互产品,智能音箱品类开始大热,去年至今国内各大厂牌都推出了自己的智能音箱,笔者昨天还看了一场某知名公司的智能音箱发布会,可见市场之火爆,然而产品虽多,真正掌握核心技术的却寥寥无几,今天给大家介绍的Rokid就是其中一家。
Rokid由前阿里M工作室主管祝铭明于2014年在杭州创立,今年一月刚刚获得一亿美元C轮融资,在美国和国内均有研发团队,目前Rokid主要致力于智能音箱和AR眼镜的研发,是行业领先的技术开发型公司。
祝铭明
第一次了解Rokid是被其去年推出的ALIEN/外星人所吸引,这是一款非常强大非常酷的多功能智能终端,非常符合其创始人追求酷的风格,然而也正是因为外星人过分追求强大炫酷,配备了陀螺仪、电子罗盘、智能捕捉摄像头和曲面投影屏幕等技术,使得其价格高昂,加上当时智能音箱属于新兴品类,市场教育远未完成,外星人最终没有取得市场成功,也许再过几年推出外星人这样的产品会是更好的选择,老实说笔者是非常喜欢这款产品的,没买主要是因为穷。
ALIEN/外星人
吸取外星人的教训后,Rokid推出了新产品月石,基本上就是去掉了屏幕和陀螺仪等高价值器件后的外星人,定位由多功能智能终端还原到智能音箱,价格也做到了和其他主流产品同步,销量也自然提升。
月石
Rokid作为一家以技术开发为核心业务的公司,完全可以作为技术供应商为其他厂牌提供服务,之所以进入到消费智能硬件的生产销售领域,按照祝铭明自己的说法,他是一个控制狂,很难接受别人用他们辛辛苦苦研究的技术做一个极其丑陋的东西,其实这句话直白点说就是Rokid的技术很牛逼,不想被劣质厂商砸了牌子。另外人工智能技术还处在早期阶段,自己做产品示范和延展产品线也是非常划算的,但这并不代表Rokid放弃了作为技术供应商的根本,这次发布的Rokid全栈语音智能开发套件正是基于这一业务开发的,也是Rokid第一次开放他的技术。
也许是开发版的原因,Rokid全栈语音智能开发套件的包装盒没有任何装饰,也没有说明书,然而这并不是敷衍,继续打开有惊喜。
虽然外面的纸盒比较简易,内部的泡沫保护却严丝合缝,说明这不是包装没来得及设计的临时之举,而是不在没必要的地方浪费成本,毕竟开发版不是面对消费市场的产品。
Rokid全栈语音智能开发套件的内包装是非常漂亮的铁罐包装,笔者对这种铁罐包装是非常喜欢的,觉得很高级,其实我父母那一代人铁罐包装是比较主流的包装,反而塑料和纸盒包装难以见到。
内部是千层饼式的叠层码放,空间利用率高又非常规整,每一层之间都有泡沫分隔,防止电路板划伤。
全部内容物包括组装好的CPU板+MIC板,未组装的DEBUG板,电源线,DEBUG板的排线和铜柱,因为开发套件是针对技术开发者的生产工具,本身有一定技术门槛,因此没有随机说明书,有专门网站和技术论坛提供技术支持。
Rokid全栈语音智能开发套件采用开放式设计,用两片透明的有机玻璃对电路加以保护,一方面有利于散热,一方面取消非必要原件节省成本,最主要的是能够直观展示Rokid漂亮的电路排版,这大概就是技术宅所追求的浪漫吧,同时其饼干大小的体积方便放在口袋里随身携带。
可以看到Rokid开发套件采用优质黑色PCB,正面甚至消耗一层铜箔蚀刻了Rokid的logo,时钟刻画的位置是12颗RGB LED,点亮之后非常酷炫,四个开孔构成麦克风阵列,提高声音识别率。
Rokid开发套件做成透明外壳是来自技术宅的炫耀,电路排布非常规整漂亮,背面的主芯片电路排布和主要接口一览无余,开发套件自然要提供更多的可能性,除了提供音频接口外还提供了高清视频接口。
对于普通用户来说,可以将Rokid开发套件视为一款没有电池和喇叭的月石,将其连接到任意扬声器上即可将其变成一款与月石相同功能的智能语音音箱,非常方便,效果酷炫。通电后需要一段时间开机,此时LED为蓝色跑马灯形式。
开机较为迅速,系统启动完成后LED灯变成粉红色。
在Rokid的APP种选择月石连接若琪,即可与若琪对话,对话会以文字对话的形式在APP中生成记录。
得益于人工智能技术的大数据资源,若琪可以提供海量的音频资源服务,同时可以化身私人秘书提供定制化个人提醒服务,已经实现智能家居的同学则可以通过若琪控制家中的智能设备和可联网设备,比如开启灯光、窗帘或者遥控家庭机器人等等,非常方便。
连接若琪后LED灯为绿色,说出唤醒词若琪后其中一颗会变成白色,需要注意的是市面上存在没有唤醒词的智能音箱,这种设备无时无刻不在监听你的生活,存在隐私泄露风险。
关于若琪名字的由来,祝铭明在演讲中提到Rokid的声源为什么选择一个相对年轻知性的女声的原因:作为一款摆放在家庭中的物品,不能有入侵感,男性声音或者嗲嗲的女声显然都不合适,而童音又太幼稚,只有年轻知性的的女声最容易被接纳,同时也是来自英文名Rokid的音译。有趣的是Rokid比较调皮的支持改名,比如改成老板或者女朋友的名字让他给你干活,具祝铭明讲他去同事家玩发现同事家的Rokid系统用他的名字而且忘记改回去了,不知道祝老板有没有打这位同学的屁股。
下面是笔者与若琪的第一次交流,若琪的反应速度还是很快的,人工智能比很多大厂牌要好很多,真正掌握核心科技。
若琪作为一款人工智能,每一次回答都是基于算法和已有数据优化得出,同样的问题未必得到同样的结果,当然也偶尔出现算力不足的情况,比如让其唱歌有时可以有时说还没学会。人工智能不是人,偶尔会出现下面这样的逗比对话,笔者让其播报新闻后拒绝停下,大概是因为停下和停止在程序中所做定义不同所致,目前人工智能还处在技术成长期,随着算法的迭代和数据的积累会越来越聪明,她会记住每个人的声音,喜好,针对每个人提供不同的反馈结果。
不知道大家注意到没有,笔者与若琪互动时没有说你好若琪或嗨若琪,仅仅说若琪系统就能很好的识别,这是目前中文智能语音领域唯一实现唤醒词为二字的系统,看似简答的一字之差却是目前该领域最为顶尖的技术和难题,Rokid的北京博士团队为了实现将唤醒词由嘿若琪到若琪的跨越整整攻坚了一年半,可以说Rokid的技术是目前中文语音交互领域最为领先的,之所以纠结这一字之差,是Rokid对使用场景生活化的追求,比如你晚上让若琪开灯的时候说若琪开灯还是你好若琪开灯,哪个更自然更符合生活场景一目了然。
对于普通人来说Rokid是个非常酷炫的玩具,功能强大,也非常实用,对于技术宅或开发者,Rokid开发套件提供了完全开放的技术平台,国际领先的技术支持,以及广阔的预期市场空间,可以在其上试验自己的技术设想,做各种的尝试,或者使用Rokid的技术平台开发自己的产品在市场上售卖。
因为系统开放,具备软件开发能力的智能音箱厂家可以直接使用Rokid开发套件的技术方案,在其系统上优化自己的方案,甚至直接照搬官方系统。
对于硬件开发团队来说,则有着更为广阔的空间,如今是万物互联的时代,语音控制是万物互联最好的解决方案之一,硬件开发团队要实现功能,就要用到这块DEBUG板了。
DEBUG板提供TYPE-C、USB2.0、GPIO口、红外遥控接收、操作按钮扩展等配置方便开发者做各种尝试,比如将其连接到咖啡机上编制相应程序就实现了咖啡机的语音交互控制,同理可以广泛的用于传统家电改造,当然这样比较大材小用,作为比较高级的人工智能语音交互系统,Rokid全栈语音智能开发套件完全可以作为交互式机器人的大脑,比如笔者昨天看的发布会中发布的互动式机器人,其核心技术就是语音识别+视频捕捉+人工智能的应用,而这些功能Rokid全栈语音智能开发套件配合驱动机构均可实现。
由于笔者没有可以改造的家电和硬件,所以没有安装这块DEBUG板,其实安装比较简单,用安装铜柱固定后连接排线即可。
系统方面Rokid全栈语音智能开发套件支持安卓和Linux,由于笔者连大学学的C语言都还给老师了,不具备软件开发能力,加上Rokid寄到时笔者在其他地方,目前仅玩了几个小时,没有深入研究软件开发界面,所以从论坛上扒了几张示例给大家,流程看起来比较简单,对具备软件开发能力的同学来说应该没有门槛。
综上,Rokid全栈语音智能开发套件对于普通用户来说是一款炫酷的玩具,对于技术宅来说是炫技神器,对于开发者来说是生产工具,是Rokid作为领先技术提供商第一次开放自身技术平台,与开发者用户对接的桥梁,是Rokid打造其技术供应链的第一次尝试。
值得一提的是Rokid全栈语音智能开发套件也是一块高品质的声卡,音质非常不错,最后,祝Rokid大红大紫,全栈语音智能开发套件推广顺利。