向工程师致敬——Rokid全栈语音智能套件上手

你为什么不吃胡萝卜 你为什么不吃胡萝卜 2018-04-02 18:41

硬件配置强大,Kit内外合一:精简、漂亮、强劲、完整,全栈开放,高效便捷的人机交互,应用场景丰富,开发平台优秀--无论是能力支持还是文档,客户支持很nice。

系统目前还是有些小问题,譬如配好网络连接后的前几次开机总是连不上网络,需要反复重启几次才行,不知道是无线路由器的问题还是什么~

零、前言     

首先感谢新浪众测选中本人参与此次Rokid全栈语音智能开发套件众测活动,感谢新浪,感谢编辑……我爱你们!么么哒~

关于理由:为什么要申请此次众测?理工男还是喜欢捣鼓一些新奇的电子器件的,树莓派亮过屏,Anduino跑过马灯,摆弄过Cortex-M3/M4系列MCU……囧rz,这个Rokid全栈语音智能开发套件出现简直让本屌眼前一亮,可以玩大点,让我们在AI的道路上越走越远。

关于图片:本次测评所有照片及Rokid APP截图均出自近两年来不离不弃的iPhone 7Plus,刷机烧写工具图片源自于计算机。

一、开箱

3月7日下班时分得知被众测菌选中后,激动的立马打款确认收货信息,然后进入漫长的等待时期,然后上周五官方信息说寄出,过了周末,在本周一的早上收到了。开箱会上瘾,忍不住看了看自己的双手(还好还在,没有被剁掉),再看看拆开快递箱的Rokid全栈语音智能开发套件原生包装盒,如下:

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图1-1 带有“新浪众测”标志的产品包装盒

打开外包装盒,摸出一个哑光黑色的圆柱铁盒,顶盖上是Rokid标志,圆柱体上“Rokid AI Dev Kit”字样表明这是Rokid智能开发套件。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图1-2 铁盒包装外观

揭开铁盒上盖,麦克风阵列板与核心板已经连接好,上下用亚克力材质透明板材装饰,起到保护作用,美观&安全。菌龟星用到的黑色的PCB,覆上金色字体,显得高档大气。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图1-3 本尊现身

开发套件包括:

1、一个核心板;

2、一个麦克风阵列板(包括LED灯光阵列);

3、一个Debug板;

4、一根USB Type-C线,三颗铜柱用于扩展Debug板。

二、硬件介绍

为了让大家更详细的了解Rokid全栈语音智能开发套件的硬件,本屌决定手贱拆机并顺便加上Debug板,从而三板合体,简称三体[手动滑稽]。

1、核心板

首先是核心板,左侧的芯片是Amlogic S905D SoC,核心板中的核心,配备四核64位 ARM® Cortex™-A53,五核ARM® Mali™-450,采用28nm HKMG工艺制造,更多产品细节参见http://www.amlogic.cn/#Products/198/index.html;右侧的芯片是三星电子的KMQE60013M-B318芯片,集成16GB容量的的eMMC 5.1和16Gb(注意这里是小写的b,也就是2GB)的LPDDR3,具体细节见http://www.samsung.com/semiconductor/mcp/KMQE60013M-B318/。下方的二维码覆盖芯片是一颗提供wifi与蓝牙功能的芯片;同时,此板具备Type-C、Micro HDMI、3.5音频口、SPK接口。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图2-1 核心板

核心板通过正反面2个排线接口分别连接Debug板和麦克风阵列板。

2、麦克风阵列板

下图右侧就是麦克风阵列板,其上点缀着12颗彩色LED及4个MIC(有6MIC版本的)。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图2-2 麦克风阵列板与核心板

3、Debug板

Debug板载一颗飞特帝亚(FTDI)的FT232R芯片,用于USB 转 UART;Debug板提供30pin GPIO,提供Type-C、USB、红外接口,以及6个按钮,分别对应UPGRADE(软件升级)、PWR(电源)、VOL-(音量降低)、VOL+(音量增大)、MUTE(静音)、RST(重启)。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图2-3 Debug板

最后三块PCB合体,侧面可以很清楚的看到2根FPC排线把3快板子连接起来,做的很精妙。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图2-4 加上Debug板

三、联网&刷机

Rokid全栈语音智能开发套件不联网那就啥事都干不成,首先下载Rokid APP,按照APP指导步骤,先对套件上电,纳涅?翠绿的不动了,虽然隔壁不是老王,但是隐隐感觉不正常,不科学啊,于是问问群里的Rokid支持,答曰联网不成功。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图3-1 绿油油的光,心慌慌

反正目前系统是Android,那我们来刷机吧~

1、先下载AML的刷机工具USB Burning Tool并安装;

2、再在Rokid官网下载最新的aml_upgrade_package.img(位于ftp://ftp-customer.rokid-inc.com:9921/images/nanat2/);

3、打开USB Burning Tool,同时按住 Debug 板上的 UPGRADE 和RST 键几秒后松开,刷机工具界面出现连接成功,表示开发板已经进入刷机模式;

4、USB Burning Tool中打开下载的aml_upgrade_package.img,之后点击“开始”,耐心等几分钟后刷机完成即可;

如果刷机过程中有错误,建议先停止,然后再次刷,我就是刷第三次才成功的,有人告诉我是USB信号不稳定导致。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图3-2 三次刷机

刷好了,那继续联网吧。一会LED蓝光闪烁过后,进入紫色的状态,嗯不错,终于可以联网了。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图3-3 风骚的紫色LED灯光

接下来,打开Rokid APP,添加设备(我是添加Pebble)。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图3-4 Rokid APP添加设备界面

之后便是按照指南的套路,顺利连上wifi。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图3-5 通过蓝牙联网

之后一阵清脆的人声,你好,若琪~绿色全亮表示成功启动:)

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图3-6 你好,若琪!

Rokid APP可以看到沟通记录。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图3-7 你好~

四、技能开发

既然是测试Rokid全栈语音智能开发套件,那必须开发下,说是开发,我这次展示的其实就是一些简单配置,因为公司已经把平台做好,一些接口也挺傻瓜的,6步就能创建一个语音技能,这极大的降低了语音技能开发门槛。

下图是一个经典的流程图,展现了Rokid完整的语音交互流程,看懂了这个图,后面的工作就很好做了。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图4-1 Rokid语音交互流程

1、语音交互

通过意图定义将用户所说的根intent(意图)联系起来,譬如我要把“哪里有好一点的咖啡馆”“哪里好点的咖啡馆”“哪里有好点的咖啡馆”这种问题抽象起来,事实上这些问题都代表用户同一个目的,就是想找个好点的咖啡馆,所以这几句话的意图命名为“bestcoffeebar2018”,也就是说只要用户问上述问题,Rokid server立即能关联到bestcoffeebar2018意图。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图4-2 意图配置

配置好了后保存,并且编译,还可以测试。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图4-3 语音交互案例编译

2、配置

配置主要是将前面设置的意图根反馈映射起来,好让系统通过意图找到反馈并回应用户,具体字段不再说明,具体参考官方开发文档。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图4-4 配置

配置好了还可以配置测试用例进行测试。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图4-5 配置测试用例

3、集成测试

第1、2步将整个流程要做的工作都做好了,但是各自步骤是孤立的,都通过了各自步骤的测试,没有集成测试过:)首先添加测试设备,再集成测试,把整个业务流程走一遍,平台做的很方便,测试的时候请求跟返回内容都显示。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图4-6 集成测试

之后便是“发布”和“隐私合规”步骤,非常简单。

从这样一个流程来看,Rokid技能开发非常方便,而且平台提供的一些小工具小特性非常贴心,赞!

语音接入因为需要备案,所以就来不及尝试。

五、其他只能产品对比

刚好手头有个联想的智能音响,对比下来几点个人感受,因为时间比较短,不一定准确:

1、语音控制上,无论是辨识度还是反应速度,Rokid比联想要好些;

2、联想的音质令人印象深刻,Rokid不带音响;

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

图5-1 你好联想, 你好若琪

3、常规的功能貌似现在市面上的智能(音响)设备感觉都差不多,但是Rokid提供众多“技能”,而且可以添加需要的技能,实在不行可以自己撸袖子上:)

向工程师致敬-Rokid全栈语音智能开发套件上手_新浪众测

图5-2 若琪技能出众

六、下一步工作

1、S905D是个强大的SoC,各种硬解码,Kit刚好配置了HDMI,所以想用来看看电影;

2、RokidOS很有意思,下次装个Docker试试;

3、Kit留了30pin,联系到前阵子学习Node.JS,觉得能捣鼓很多好玩的出来,譬如语音控制GPIO。

向工程师致敬--Rokid全栈语音智能开发套件测试_新浪众测

(最后感谢各位看官耐心阅读:))

(声明: 本文著作权归作者本人和新浪众测共同所有,未经许可不得转载。本文仅代表作者观点,不代表新浪众测立场。)
0 0
分享 商务合作 返回
微博 QQ空间 微信