当你面对电脑里日渐庞大的相册时,你肯定会为寻找某一张照片而不知所措,即使你对照片中的场景记忆犹新。Matt Richardson制作的相机或许能帮你,它可将照片中所包含的信息转换成描述性文字,从而实现精确搜索。
这台相机名为Descriptive Camera,由BeagleBone驱动,它是TI推出的一套嵌入式Linux平台。与BeagleBone相连的部件有一个USB摄像头、一台Adafruit热敏打印机、三个LED状态指示灯和一个快门按钮。一系列Python语言的脚本定义接口,并将部件的各种不同的动作和状态组合在了一起。
Descriptive Camera的整体外观
Descriptive Camera的核心技术是亚马逊的Mechanical Turk API,它能让开发者通过网络,将那些需要靠人类智慧才能进行的任务(Human Intelligence Tasks,简写为HITs)交给其他人来完成。开发者给任务执行者提供指导意见,设计提交结果的界面,并定下完成任务的酬劳,构建良好的信誉评价系统可以确保任务执行者提供令人满意的结果。
为了更快、以更小的开销地获得结果,这台相机可被设置到“帮凶模式”,这时它会将即时信息发送给每一个人,其中会包含一个图片的链接和一个他们可以输入图片描述的表格。
Descriptive Camera的内部构造
“mrBBIO模块被用来进行GPIO控制(LED灯和快门按钮),我用开源的命令行工具与Mechanical Turk沟通,设备通过以太网接入互联网,并通过外置的5v电源获得电力。”Richardson介绍道。当按下快门按钮后,照片会被发送到Mechanical Turk,相机会等待结果返回,亮起的黄色LED灯表示结果仍在制作中。在每个HIT的报酬为1.25美元的情况下,返回结果通常在6分钟以内,有时只需3分钟,热敏打印机会以宝丽来的打印样式输出文本结果。
Descriptive Camera输出的结果